资讯类网站开发文档济南制作网站
news/
2025/9/23 22:52:26/
文章来源:
资讯类网站开发文档,济南制作网站,做一个网站中的搜索功能怎么做,设计的软件都有什么此系列文章收录在公众号中#xff1a;数据大宇宙 数据处理 E-pd转发本文并私信我python#xff0c;即可获得Python资料以及更多系列文章(持续更新的)经常听别人说 Python 在数据领域有多厉害#xff0c;结果学了很长时间#xff0c;连数据处理都麻烦得…此系列文章收录在公众号中数据大宇宙 数据处理 E-pd转发本文并私信我python即可获得Python资料以及更多系列文章(持续更新的)经常听别人说 Python 在数据领域有多厉害结果学了很长时间连数据处理都麻烦得要死。后来才发现原来不是 Python 数据处理厉害而是他有数据分析神器—— pandas前言上一节我们重点介绍了针对文本条件的统计方式这次来把数值相关的讲解一下并且用一个 Excel 操作思维带你理解 pandas 的运算逻辑。继续使用泰坦尼克号沉船事件的乘客名单作为例子pclass船舱等级survived是否生还fare票价sex性别home.dest住址如果你看过上一节文章想必应该理解到在 pandas 中不管是数值或是文本的条件统计本质都是构造条件 bool 列之后的处理是一样的。废话少说直接看各种复杂需求案例1简单需求30岁以上的人数先看看 Excel 函数公式的做法简单使用 countifs 即可注意第二个参数使用文本(双引号包围)主要是因为需要使用 大于号。这使得函数公式的语义更好pandas 中数值条件也很非常容易表达行1df.age 30 构造出年龄大于30的 bool 列与 Excel之间的关系你会发现其实 pandas 中的运算操作与 Excel 函数公式的运算是非常相似(数组公式更相似)pandas 的操作就像你在第一行写了一个处理逻辑公式他就自动为你把逻辑公式复制一整列。不知道我说啥看看下面的 Excel 操作演示来实现30岁以上的人数:代码 df.age 30 相当于如下操作pandas 代码 df.age 30 构造出条件 bool 列过程如上在数据旁边新增一列直接执行 C2 单元格是否大于30结果是一个 bool 值由于 pandas 代码是直接指定 年龄 列是否大于30因此相当于自动把 E2 单元格的公式复制下去此时代码 df[cond] 相当于如下操作df[cond] 相当于 df[df.age 30]相当于在辅助列上做筛选把 true 值的行筛选出来所以你会发现如果只是执行 df[cond] 得到的是那些年龄大于30的行如果你熟悉 Excel 的功能你可能会说这不就是智能表格是的智能表格更能体现如下创建表格在表格旁边输入公式注意此时公式中的引用不是单元格地址而是直接以列名显示这个地方与 pandas 非常相似这是因为他们都是在表达你在操作一个有结构的表格当你按下回车公式自动填充其他各种需求当你理解了上面的思路那么只要你熟悉 pandas 各种构造 bool 列的技巧各种需求基本难不倒你。30岁以上 男女的人数一个个写太麻烦了直接条件筛选分组统计男女高于各自性别的平均年龄的人数有没有发现男性的人数与之前需求的人数很接近因为刚好男性的平均年龄在30岁左右当然还是可以直接分组统计的男女各自年龄最小的人的资料他们都在 S 港口上船同是三等舱女生获救了男生遇难了男女各自年龄最大的人的资料他们都是在 S 港口上船同是一等舱他们都获救了一等舱可能更靠近甲板逃生更容易最后来一个复杂一点的需求。看看各个年龄段男女的生还情况简单让 pandas 按数据中的年龄平均划分成4段大概可以看出男性的生还率低于女性特别是20到40岁这个年龄段更多针对泰坦尼克号沉船事件数据的详细分析可以查看 公众号中数据大宇宙 数据分析 探索分析 系列文章关于透视表和数据分段请查看 pandas 专栏 [带你玩转Python数据处理—pandas] 相关文章
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/914147.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!