Python---pandas

一、Pandas 显示设置 (Option)

这些命令决定了你在屏幕上看到数据的样子,通常放在脚本的最开头。

命令解读代码示例
显示所有列别让中间的列变成省略号...pd.set_option('display.max_columns', None)
显示所有行慎用!数据量大时会刷屏pd.set_option('display.max_rows', None)
内容不截断让长文本(如路径)完整显示pd.set_option('display.max_colwidth', None)
自动换行控制防止表格太宽被强行折叠pd.set_option('display.width', 1000)
查看设置说明忘记参数怎么写时查阅说明书pd.describe_option('display')

二、 核心工具:Pandas 常用操作命令

1. 数据概览(初步体检)

在处理单细胞数据(如muxu.obs)时,先看一眼表格的结构。

importpandasaspd df=muxu.obs# 假设 df 是你的样本信息表print(df.head(10))# 查看前 10 行print(df.columns)# 查看所有的列名print(df.info())# 查看每列的类型、是否有空值print(df.shape)# 查看表格的大小(行数, 列数)
2. 数据统计(摸清家底)

统计每个类别出现的频率。

# 统计每个细胞类型有多少个细胞print(df['celltype'].value_counts())# 统计每个样本(batch)的分布print(df['batch'].value_counts())# 查看数值列(如 nCount_RNA)的平均值、标准差、最大最小值print(df['nCount_RNA'].describe())
3. 数据筛选(精准定位)

从几万行数据中选出你想要的。

# 选出所有属于 CD 组的细胞cd_data=df[df['orig.ident']=='CD']# 选出 Cortex 且 RNA 计数大于 500 的细胞filtered_data=df[(df['celltype']=='Cortex')&(df['nCount_RNA']>500)]
4. 数据修改(手术修整)

给表格增加信息或改名。

# 修改列名:把 'orig.ident' 改为 'Group'df=df.rename(columns={'orig.ident':'Group'})# 新增一列:提取细胞 ID 的前缀df['sample_prefix']=df.index.str.split('_').str[0]

三、 针对你的项目:快速检查muxu数据

你可以直接把这段代码粘贴到你的 Python 环境中运行:

importpandasaspdimportscanpyassc# 1. 极简显示配置pd.set_option('display.max_columns',None)pd.set_option('display.width',1000)# 2. 读取数据adata=sc.read_h5ad("muxu.h5ad")df=adata.obs# 3. 核心三连看print("--- 1. 前 5 行预览 ---")print(df.head())print("\n--- 2. 所有列名清单 ---")print(df.columns.tolist())print("\n--- 3. 实验设计验证 ---")if'batch'indf.columns:print(df['batch'].value_counts())else:print("警告:未发现 batch 列,可能需要手动从 index 提取!")

💡 小贴士

  • **点号.与中括号[]**df['celltype']df.celltype大部分时候是一样的,但如果列名里有空格或特殊符号,必须用['列名']
  • 不改变原数据:绝大多数 pandas 操作(如rename,dropna)默认不修改原表格,而是返回一个新表格。所以记得写成df = df.rename(...)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1136015.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

牛批了,AI办公神器,值得收藏

今天给大家推荐一款厉害的office AI助手,这是一款智能AI的办公软件,专门为office和WPS量身定做,有需要的小伙伴一定要下载收藏一下。 Office AI 助手 兼容officee和WPS 软件很小巧,大小只有不到30M,双击之后安装完成就…

display driver uninstaller清理AMD驱动的核心要点

彻底清理AMD显卡驱动:为什么你必须用Display Driver Uninstaller? 你有没有遇到过这样的情况?明明从AMD官网下载了最新的Adrenalin驱动,安装时却弹出“Error 1603”错误;或者刚装完驱动,屏幕闪烁、分辨率锁…

零基础理解AUTOSAR模块间交互逻辑

信号如何在汽车芯片间“快递”?一文讲透AUTOSAR模块协作真相你有没有想过,当你踩下油门时,为什么仪表盘上的车速能瞬间跳动?这背后并不是简单的电线直连,而是几十个电子控制器通过复杂的“对话协议”协同工作的结果。现…

DuRoBo Krono:搭载AI助手的智能手机尺寸电子阅读器

荷兰公司DuRoBo在2026年国际消费电子展上展示了一款名为Krono的全新电子阅读器,该公司在周二的新闻发布会上表示,这款产品拥有智能手机般的外形设计,并内置了AI助手功能。Krono被定位为一款"电子纸专注中枢",专为阅读、…

DuRoBo Krono:搭载AI助手的智能手机尺寸电子阅读器

荷兰公司DuRoBo在2026年国际消费电子展上展示了一款名为Krono的全新电子阅读器,该公司在周二的新闻发布会上表示,这款产品拥有智能手机般的外形设计,并内置了AI助手功能。Krono被定位为一款"电子纸专注中枢",专为阅读、…

PDF编辑神器,免费国际版

打工人平时工作时需要处理一些PDF文档,但是WPS有一些功能是收费的,所以今天给大家推荐的一款国外的软件完全免费。而且没有广告。 PDF 24 Tools PDF编辑工具 双击这个图标,打开软件。 软件打开后是没有界面的,在电脑的右下角就可…

pytorch深度学习笔记12

目录 摘要 输出层的反向传播和实现 摘要 本篇文章继续学习尚硅谷深度学习教程,学习内容是输出层的反向传播和代码实现 输出层的反向传播和实现 在输出层,我们一般使用Softmax作为激活函数。 对于Softmax函数: 其偏导数为: 而对…

开发一款APP费用是多少?影响价格的几大核心因素

开发 APP 的费用没有标准答案,核心由功能模块的复杂程度、开发的具体模式、技术栈的选用、开发团队的专业配置等因素决定,整体费用从几万到数百万元不等。下文将依据APP的类型划分,为你呈现对应的费用参考,助力精准把控成本范围&a…

DUT功能验证中的断言使用技巧:实战经验分享

断言实战指南:如何用SVA为DUT验证装上“雷达眼”你有没有遇到过这样的场景?一个复杂的SoC设计在仿真中跑了整整一晚,第二天打开波形一看——数据错乱、协议违规、状态跳转异常……但问题到底出在哪一拍?是驱动没对齐,还…

T触发器时序行为深度剖析:建立与保持时间详解

T触发器时序行为深度剖析:建立与保持时间详解在数字电路的世界里,一个看似简单的“翻转”动作背后,往往藏着极为严苛的时序规则。T触发器(Toggle Flip-Flop)就是这样一个典型例子——它逻辑简洁、应用广泛,…

T触发器时序行为深度剖析:建立与保持时间详解

T触发器时序行为深度剖析:建立与保持时间详解在数字电路的世界里,一个看似简单的“翻转”动作背后,往往藏着极为严苛的时序规则。T触发器(Toggle Flip-Flop)就是这样一个典型例子——它逻辑简洁、应用广泛,…

Elasticsearch资源隔离配置教程

Elasticsearch资源隔离实战:从JVM到索引的全链路稳定性保障 你有没有遇到过这样的场景? 凌晨三点,线上告警突然炸了——搜索接口大面积超时,监控平台图表一片红色。排查发现,并不是核心业务出了问题,而是某…

入驻爱发电

我的爱发电地址:https://afdian.com/a/xiangyu

图解说明:PyTorch推荐系统中的Embedding层设计

深入理解PyTorch中的Embedding层:推荐系统的“向量引擎”如何工作?你有没有想过,当你在抖音刷到一个恰好合口味的视频,或是在淘宝看到“怎么这么懂我”的商品推荐时,背后是谁在默默计算你的“数字画像”?答…

一文搞懂RLHF (基于人类反馈的强化学习)

一、先搞懂:RLHF的核心逻辑与基础概念 在深入步骤前,我们需要先理清几个关键概念,避免被术语绕晕: 1. RLHF的核心目标 简单说,RLHF的目标是让模型的输出“对齐人类意图” ——这里的“对齐”包含三层含义: …

利用udev规则屏蔽工业Linux系统中的未知USB设备(设备描述)

如何用udev规则给工业Linux系统加一道“USB防火墙”?你有没有遇到过这样的场景:一台部署在工厂车间的工控机,平时跑得好好的,结果某天突然宕机、数据异常,排查半天发现是有人插了个U盘拷走了生产日志?更糟的…

三维动态避障路径规划:基于融合DWA的部落竞争与成员合作算法(CTCM)求解无人机三维动态避障路径规划研究,MATLAB代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室👇 关注我领取海量matlab电子书和数学建模资料 &#x1f34…

OpenAI推出ChatGPT Health医疗问答功能

OpenAI集团今日预览了ChatGPT Health功能,这是一项即将推出的新特性,旨在帮助聊天机器人用户获取医疗信息。ChatGPT Health以ChatGPT界面中的新版块形式出现。据OpenAI介绍,当用户在主聊天框中输入医疗相关问题时,聊天机器人会自动…

AI 赋能学术:paperxie 毕业论文写作功能,让硕士 3 万字论文从选题到成稿更高效

paperxie-免费查重复率aigc检测/开题报告/毕业论文/智能排版/文献综述/aippt https://www.paperxie.cn/ai/dissertationhttps://www.paperxie.cn/ai/dissertation 对于硕士阶段的学术研究者而言,一篇 3 万字的毕业论文,往往需要经历选题、文献梳理、数…

丘成桐数学科学领军人才培养计划毕业后安排和薪资

丘成桐数学科学领军人才培养计划采用“323”八年制本博贯通培养,不设本科毕业环节、不发本科毕业证与学位证,达到博士学位要求后授予数学理学博士学位;未达博士要求但完成前5年培养可申请理学学士学位;前5年不适应可转入数学系本科…