Pandas语句

数据加载与保存
读取数据
pd.read_csv(‘filename.csv’)：读取 CSV 文件。
pd.read_excel(‘filename.xlsx’)：读取 Excel 文件。
pd.read_sql(query, connection_object)：从 SQL 数据库中读取数据。
pd.read_json(‘filename.json’)：读取 JSON 文件。
保存数据
df.to_csv(‘filename.csv’)：将数据保存为 CSV 文件。
df.to_excel(‘filename.xlsx’)：将数据保存为 Excel 文件。
df.to_sql(‘table_name’, connection_object)：将数据保存到 SQL 数据库中。
df.to_json(‘filename.json’)：将数据保存为 JSON 文件。
数据查看与检查
查看数据
df.head(n)：查看数据框的前 n 行（默认 5 行）。
df.tail(n)：查看数据框的后 n 行（默认 5 行）。
df.sample(n)：随机抽取 n 行数据。
数据框信息
df.info()：查看数据框的基本信息，包括列名、数据类型和缺失值等。
df.describe()：查看数据框的统计描述，包括计数、均值、标准差、最小/最大值等。
列名与索引
df.columns：查看数据框的列名。
df.index：查看数据框的索引。
数据清洗与预处理
缺失值处理
df.dropna()：删除包含缺失值的行或列（根据参数 axis）。
df.fillna(value)：用指定值填充缺失值。
df.interpolate()：用插值方法填充缺失值。
数据转换
df[‘column’].astype(dtype)：转换列的数据类型。
df.apply(func, axis=1)：对数据框的每一行或列应用函数（根据 axis 参数）。
df.map(func)：对数据框的某一列应用函数（通常用于替换值）。
数据筛选
df[df[‘column’] > value]：基于列的条件筛选行。
df.query(‘column > value’)：用查询字符串筛选行。
df.loc[row_indices, col_indices]：基于行和列的索引选择数据。
df.iloc[row_indices, col_indices]：基于行和列的整数位置选择数据。
数据排序
df.sort_values(by=‘column’)：按指定列的值排序。
df.sort_index()：按索引排序。
数据去重
df.drop_duplicates()：删除重复行。
数据合并与分组
pd.concat([df1, df2], axis=0)：沿指定轴连接数据框（默认是行连接）。
pd.merge(df1, df2, on=‘column’)：基于指定列合并数据框（类似 SQL 的 JOIN）。
df.groupby(‘column’).agg(func)：按指定列分组，并对每组应用聚合函数。
文本处理
df[‘column’].str.lower()：将列中的字符串转换为小写。
df[‘column’].str.upper()：将列中的字符串转换为大写。
df[‘column’].str.contains(‘pattern’)：检查列中的字符串是否包含指定模式。
df[‘column’].str.replace(‘pattern’, ‘replacement’)：替换列中字符串的指定模式。
数据可视化（简单）
虽然 Pandas 本身不是专门的可视化库，但它提供了一些简单的可视化工具：
df.plot.line()：绘制折线图。
df.plot.bar()：绘制条形图。
df.plot.hist()：绘制直方图。
df.plot.box()：绘制箱线图。
df.plot.scatter(x=‘col1’, y=‘col2’)：绘制散点图。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/bicheng/54415.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

Pandas语句

相关文章

蓝桥杯2024省C

深度学习自编码器 - 收缩自编码器（CAE）篇

【贪心算法】贪心算法一

【安当产品应用案例100集】017-助力软件服务商高效集成多因素认证

创建Django 项目

OJ在线评测系统前端开发设计优化通用菜单组件二调试用户自动登录

UAC2.0 麦克风——同时支持 16bit，24bit 和 32bit

2017年国赛高教杯数学建模A题CT系统参数标定及成像解题全过程文档及程序

瑞芯微RK3588开发板Linux系统添加自启动命令的方法，深圳触觉智能Arm嵌入式鸿蒙硬件方案商

U盘显示未被格式化：深度解析与数据恢复指南

Java 数据类型转换详解：隐式转换（自动转换）与强制转换（手动转换）

如何上传tauri项目到csdn gitcode

代码随想录：打家劫舍||

【计算机基础题目】二叉树的前序中序后续遍历之间相互转换详细例子

基于SSM的宿舍管理系统的设计与实现（含源码+sql+视频导入教程+文档+PPT）

POI操作EXCEL增加下拉框

傅里叶变换的基本性质和有关定理

秋招突击——9/10、9\11——算法练习——携程笔试练习——2024年秋招第一批笔试

【读书笔记-《30天自制操作系统》-22】Day23

模版进阶（template）