宝丰县建设局网站wordpress文章在哪个文件夹
宝丰县建设局网站,wordpress文章在哪个文件夹,西安网站制作开发公司哪家好,有没有专门做游戏辅助的网站pandas简介#xff1a;pandas包含的数据结构和数据处理工具的设计使得利用进行数据清洗和数据分析非常快捷#xff1b;与numpy的区别#xff0c;pandas用来处理表格型或异质型数据的#xff0c;而numpy更适合处理同质型的数值类数据。 1、Series简介 1、Series是一种一维的… pandas简介pandas包含的数据结构和数据处理工具的设计使得利用进行数据清洗和数据分析非常快捷与numpy的区别pandas用来处理表格型或异质型数据的而numpy更适合处理同质型的数值类数据。 1、Series简介 1、Series是一种一维的数组型对象包含以一个值序列并且包含数组标签(称为索引) pd.Series([4,7,-5,9]) # 不指定标签时默认索引值和numpy数组相似
Out[108]:
0 4
1 7
2 -5
3 9
dtype: int64pd.Series([4,7,-5,9],index[b,a,c,d]) # 指定标签标签可以是字符串
Out[109]:
b 4
a 7
c -5
d 9
dtype: int64 2、Series与numpy函数相类似的操作风格布尔值过滤数据、与标量相乘、应用数学函数等这些操作将保持索引值链接。 obj pd.Series([4,7,-5,9],index[b,a,c,d])
obj
Out[111]:
b 4
a 7
c -5
d 9
dtype: int64
obj2[obj2 0] # 布尔值过滤obj2 * 2 # 标量操作
np.exp(obj2) # 数学函数操作b in obj2 # 逻辑判断
e in obj2 3、从两外一个角度考虑Series可以认为它是一个长度固定且有序的字典。可以将字典型的数据直接转换成Series型数据并且在将字典传递给Series构造函数时可以通过指定字典键的顺序使产生的Series保持一定的顺序。 sdata {Ohio: 35000, Texas: 71000, Oregon: 16000, Utah: 5000}
obj1 pd.Series(sdata)
obj1
Out[5]:
Ohio 35000
Oregon 16000
Texas 71000
Utah 5000
dtype: int64states [California, Ohio, Oregon, Texas] # 指定标签顺序
obj2 pd.Series(sdata,indexstates)
obj2
Out[9]: *** NaN使是pandas标记缺失值或NA值的方式
California NaN
Ohio 35000.0
Oregon 16000.0
Texas 71000.0 pd.isnull(obj2) # pandas中使用isnull和notnull函数来检查数据缺失。 Out[10]: California TrueOhio FalseOregon FalseTexas Falsedtype: bool 4、Series自动对齐索引和Series对象自身和其索引都有name属性 ***前面的obj1和 obj2相加obj1 obj2
Out[13]:
California NaN
Ohio 70000.0
Oregon 32000.0
Texas 142000.0
Utah NaN
dtype: float64 obj2.name population # 指定name属性obj2.index.name state obj2Out[15]: stateCalifornia NaNOhio 35000.0Oregon 16000.0Texas 71000.0Name: population, dtype: float64 2、DataFrame简介 1、DataFrame表示的是矩阵的数据表既有行索引也有列索引每一列可以是不同的值类型DataFrame本身是二维的但是可以分层索引在DataFrame中展现更高维度的数据。 2、DataFrame有多种创建方式常用方式是利用包含等长度列表或NumPy数组的字典来形成DataFrame如果指定顺序DataFrame的列将会按照指定顺序排列 data {state: [Ohio, Ohio, Ohio, Nevada, Nevada, Nevada],year: [2000, 2001, 2002, 2001, 2002, 2003],pop: [1.5, 1.7, 3.6, 2.4, 2.9, 3.2]}
import pandas as pd
frame pd.DataFrame(data)
frame
Out[5]: pop state year
0 1.5 Ohio 2000
1 1.7 Ohio 2001
2 3.6 Ohio 2002
3 2.4 Nevada 2001
4 2.9 Nevada 2002
5 3.2 Nevada 2003 pd.DataFrame(data, columns[year, state, pop]) # DataFrame的列会按照指定的顺序排列Out[6]: year state pop0 2000 Ohio 1.51 2001 Ohio 1.72 2002 Ohio 3.63 2001 Nevada 2.44 2002 Nevada 2.95 2003 Nevada 3.2 frame2 pd.DataFrame(data, columns[year, state, pop, debt], # 若传入的指定的列不存在将会出现缺失值可以修改默认标签 index[one, two, three, four,five, six]) frame2Out[8]: year state pop debtone 2000 Ohio 1.5 NaNtwo 2001 Ohio 1.7 NaNthree 2002 Ohio 3.6 NaNfour 2001 Nevada 2.4 NaNfive 2002 Nevada 2.9 NaNsix 2003 Nevada 3.2 NaN 3、DataFrame中的一列可以按照字典标记或属性那样检索为Series. 格式frame2[state]、frame2.yearx.columns会给出所有的标签。 frame2.year
Out[10]:
one 2000
two 2001
three 2002
four 2001
five 2002
six 2003
Name: year, dtype: int64 4、对于大型的DataFramehead()方法将来列出头部的5行DataFrame中选取的列是数据的视图而不是复制因此对Series的修改会映射到DataFrame中需要复制一列的话采用Series的copy方法格式pd.Series.copy(x.column)如果需要复制DataFrame格式x.copy([len])。 5、采用包含字典的嵌套字典创建DataFrame pop {Nevada: {2001: 2.4, 2002: 2.9},Ohio: {2000: 1.5, 2001: 1.7, 2002: 3.6}}
frame3 pd.DataFrame(pop)
frame3
Out[34]: # 字典的键作为列内部字典的键值作为行Nevada Ohio
2000 NaN 1.5
2001 2.4 1.7
2002 2.9 3.6 6、pandas中的索引对象是用于存储轴标签和其他元数据的在构造Series和DataFrame时使用的任意数组或标签序列都可以在内部转换成索引对象索引对象也包含一系列方法p135。 obj pd.Series(range(3), index[a, b, c])
index obj.index
index # 索引对象是不可变的用于无法对索引对象进行修改尝试修改时会报错Out[10]:
Index([a, b, c], dtypeobject) 转载于:https://www.cnblogs.com/Chris-01/p/11444200.html
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/88970.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!