Pandas2.2 DataFrame
Attributes and underlying data
| 方法 | 描述 | 
|---|---|
| DataFrame.index | 用于获取 DataFrame 的行索引 | 
| DataFrame.columns | 用于获取 DataFrame 的列标签 | 
| DataFrame.dtypes | 用于获取 DataFrame 中每一列的数据类型 | 
| DataFrame.info([verbose, buf, max_cols, …]) | 用于提供 DataFrame 的简要概述 | 
| DataFrame.select_dtypes([include, exclude]) | 用于根据数据类型选择 DataFrame 中的列 | 
pandas.DataFrame.select_dtypes
 
pandas.DataFrame.select_dtypes 是一个非常有用的函数,用于根据数据类型选择 DataFrame 中的列。通过指定 include 和 exclude 参数,可以选择包含或排除特定数据类型的列。
参数说明
- include: 可以是单个字符串或字符串列表,表示要包含的数据类型。
 - exclude: 可以是单个字符串或字符串列表,表示要排除的数据类型。
 
数据类型字符串
以下是一些常用的数据类型字符串:
'object': 字符串'number': 数值类型(整数和浮点数)'float': 浮点数'int': 整数'bool': 布尔值'datetime64': 日期时间'timedelta[ns]': 时间差'category': 类别数据
示例
假设有一个 DataFrame 如下:
import pandas as pddata = {'A': [1, 2, 3],'B': [1.1, 2.2, 3.3],'C': ['x', 'y', 'z'],'D': [True, False, True]
}df = pd.DataFrame(data)
 
示例1:选择所有数值类型的列
df.select_dtypes(include=['number'])
 
结果:
     A    B
0  1  1.1
1  2  2.2
2  3  3.3
 
示例2:选择所有整数类型的列
df.select_dtypes(include=['int'])
 
结果:
   A
0  1
1  2
2  3
 
示例3:排除布尔类型的列
df.select_dtypes(exclude=['bool'])
 
结果:
   A    B  C
0  1  1.1  x
1  2  2.2  y
2  3  3.3  z
 
示例4:选择所有字符串和浮点类型的列
df.select_dtypes(include=['object', 'float'])
 
结果:
     B  C
0  1.1  x
1  2.2  y
2  3.3  z
 
通过这些示例,你可以看到 select_dtypes 函数如何帮助你根据数据类型选择 DataFrame 中的列。