案例 42: 数据过滤
知识点讲解
数据过滤是数据处理中的一个基本任务。在 Pandas 中,你可以使用布尔索引来过滤符合特定条件的数据行。
- 数据过滤: 通过结合条件表达式(例如
df['A'] > 2
和df['B'] < 5
),可以创建一个布尔索引,用于选择数据集中满足这些条件的行。
示例代码
# 准备数据和示例代码的运行结果,用于案例 42# 示例数据
data_filtering = {'A': [1, 2, 3, 4, 5],'B': [5, 4, 3, 2, 1],'C': [2, 3, 4, 5, 6]
}
df_filtering = pd.DataFrame(data_filtering)# 数据过滤
filtered_data = df_filtering[(df_filtering['A'] > 2) & (df_filtering['B'] < 5)]df_filtering, filtered_data
在这个示例中,我们选择了 A
列值大于 2 且 B
列值小于 5 的行。
示例代码运行结果
原始 DataFrame (df_filtering
):
A B C
0 1 5 2
1 2 4 3
2 3 3 4
3 4 2 5
4 5 1 6
过滤后的数据 (filtered_data
):
A B C
2 3 3 4
3 4 2 5
4 5 1 6
这个结果展示了如何根据多个条件过滤数据。数据过滤是数据分析和数据清洗中非常重要的一步。