【第二月_day7】Pandas 简介与数据结构_Pandas_ day1

以下是专为小白设计的 Pandas 简介与数据结构 学习内容,用最通俗的语言和案例讲解核心概念:


一、安装 Pandas

1. 安装方法
  • 打开电脑的命令提示符(Windows)或终端(Mac/Linux)
  • 输入以下命令并回车:
    pip install pandas
    
  • 安装完成后,输入 python 进入 Python 环境,输入 import pandas as pd 验证是否成功(不报错即可)

二、Pandas 的核心数据结构

1. Series(一维数据)
  • 定义:像一个带标签的列表,比如一列Excel数据

  • 创建方法

    import pandas as pd# 用列表创建
    s1 = pd.Series([10, 20, 30, 40])# 自定义索引(类似给数据加名字)
    s2 = pd.Series([5, 3, 8], index=['苹果', '香蕉', '橘子'])
    
  • 基础操作

    # 查看数据
    print(s2.values)  # 输出数据:[5, 3, 8]
    print(s2.index)   # 输出索引:['苹果', '香蕉', '橘子']# 按索引取值
    print(s2['香蕉'])  # 输出 3# 简单计算
    print(s2 + 2)     # 所有数据加2 → 苹果7, 香蕉5, 橘子10
    
2. DataFrame(二维表格)
  • 定义:像 Excel 表格,由多列 Series 组成

  • 创建方法

    # 用字典创建(最常用)
    data = {'姓名': ['张三', '李四', '王五'],'年龄': [20, 25, 22],'城市': ['北京', '上海', '广州']
    }
    df = pd.DataFrame(data)
    
  • 显示表格

    print(df)
    # 输出:
    #    姓名  年龄  城市
    # 0 张三  20  北京
    # 1 李四  25  上海
    # 2 王五  22  广州
    
  • 核心概念

    • 列名:表格的标题(如‘姓名’、‘年龄’)
    • 索引:最左边的数字(0,1,2),类似行号

三、Series vs DataFrame

特性SeriesDataFrame
维度一维(单列)二维(多列)
数据形式单列数据+索引多列数据+列名+索引
常用场景存储单列数据(如温度)存储完整表格(如成绩单)

四、DataFrame 的常用操作

1. 查看数据
df.head(2)    # 查看前2行
df.tail(1)    # 查看最后1行
df.shape      # 显示表格形状(行数, 列数)
2. 选择数据
# 选择列
df['姓名']     # 获取“姓名”列(返回Series)
df[['姓名', '年龄']]  # 选择多列(返回DataFrame)# 选择行
df.iloc[0]    # 通过数字索引选第1行
df.loc[0]     # 同上(简单场景)
3. 添加/删除列
# 添加新列
df['性别'] = ['男', '女', '男']# 删除列
df.drop('城市', axis=1, inplace=True)  # axis=1表示列
4. 读取文件(实战)
# 读取CSV文件(比如从Excel导出的数据)
df = pd.read_csv('data.csv')

五、小练习

  1. 创建一个 Series,记录一周温度:周一18℃,周二20℃,周三22℃
  2. 创建一个 DataFrame,包含三列:商品名称(苹果、香蕉)、价格(5、3)、库存(10、8)
  3. 尝试从 DataFrame 中筛选出价格大于4元的商品

通过这个教程,你已经能用 Pandas 处理简单的表格数据啦!下一步可以学习数据清洗和统计计算 🚀

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/898975.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

欢迎来到未来:探索 Dify 开源大语言模型应用开发平台

欢迎来到未来:探索 Dify 开源大语言模型应用开发平台 如果你对 AI 世界有所耳闻,那么你一定听说过大语言模型(LLM)。这些智能巨兽能够生成文本、回答问题、甚至编写代码!但是,如何将它们变成真正的实用工具…

python多线程和多进程的区别有哪些

python多线程和多进程的区别有七种: 1、多线程可以共享全局变量,多进程不能。 2、多线程中,所有子线程的进程号相同;多进程中,不同的子进程进程号不同。 3、线程共享内存空间;进程的内存是独立的。 4、同一…

【MySQL报错】:Column count doesn’t match value count at row 1

MySQL报错:Column count doesn’t match value count at row 1 意思是存储的数据与数据库表的字段类型定义不相匹配. 由于类似 insert 语句中,前后列数不等造成的 主要有3个易错点: 要传入表中的字段数和values后面的值的个数不相等。 由于类…

TCP/IP 协议栈深度解析

1. 分层结构设计 TCP/IP协议栈采用四层模型,其分层结构与协议实现细节如下: 1.1 网络层(Network Layer) 核心功能:提供端到端的数据包路由与寻址 核心协议: IP协议(IPv4/IPv6) I…

Apache Tomcat CVE-2025-24813 安全漏洞

Apache Tomcat CVE-2025-24813被广泛利用,但是他必须要满足两个点: 1.被广泛的使用,并且部署在服务器中。 2.漏洞必须依赖在服务器中的配置。 并且漏洞补丁已经发布。 漏洞攻击方式: CVE-2025-24813 是 Apache Tomcat 部分 PUT…

怎么查看linux是Ubuntu还是centos

要确定你的Linux系统是基于Ubuntu还是CentOS,可以通过几种不同的方法来进行判断。下面是一些常用的方法: 要快速判断 Linux 系统是 Ubuntu 还是 CentOS,可通过以下方法综合验证: 一、查看系统信息文件 1. /etc/os-release 文件…

PostgreSQL 连接数超限问题

目录标题 **PostgreSQL 连接数超限问题解决方案****一、错误原因分析****二、查看连接数与配置****三、排查连接泄漏(应用侧问题)****四、服务侧配置调整****1. 调整最大连接数****2. 释放无效连接(谨慎操作)****3. 使用连接池工具…

数据结构模拟-用栈实现队列

用栈实现队列的基本操作,包括pop(), push(), empty(), peek(). 可以用两个栈来实现,一个栈保存入队的一端,也就是队尾,一个栈保存出队的一端,也就是队首。当遇到出队pop()时,如果stack out不为空&#xff…

2025最新-智慧小区物业管理系统

目录 1. 项目概述 2. 技术栈 3. 功能模块 3.1 管理员端 3.1.1 核心业务处理模块 3.1.2 基础信息模块 3.1.3 数据统计分析模块 3.2 业主端 5. 系统架构 5.1 前端架构 5.2 后端架构 5.3 数据交互流程 6. 部署说明 6.1 环境要求 6.2 部署步骤 7. 使用说明 7.1 管…

智能汽车图像及视频处理方案,支持视频智能包装能力

美摄科技的智能汽车图像及视频处理方案,通过深度学习算法与先进的色彩管理技术,能够自动调整图像中的亮度、对比度、饱和度等关键参数,确保在各种光线条件下,图像都能呈现出最接近人眼的自然色彩与细节层次。这不仅提升了驾驶者的…

跨层封装简单介绍

跨层封装 跨四层封装 数据封装时不经过第四层(传输层)。应用层封装后直接来到网络层。一般出现在直连路由设备之间。代表协议: OSPF协议、ICMP协议。 既然不经过四层封装,那四层相应的功能由谁来实现?答案是由三层&a…

SSE进阶详解

嗯,用户的问题涉及到SSE在处理富媒体文件、早期聊天应用选择SSE的原因,以及如何控制流式渲染频率。我需要根据提供的搜索结果来解答这些问题。 首先,关于SSE传输富媒体文件的问题。根据搜索结果,SSE是基于文本的,比如…

React - LineChart组件编写(用于查看每日流水图表)

一、简单版本 LineChart.tsx // src/component/LineChart/LineChart.tsx import React, {useEffect,useRef,useImperativeHandle,forwardRef,useMemo,useCallback, } from react; import * as echarts from echarts/core; import type { ComposeOption } from echarts/core; …

Web前端考核 JavaScript知识点详解

一、JavaScript 基础语法 1.1 变量声明 关键字作用域提升重复声明暂时性死区var函数级✅✅❌let块级❌❌✅const块级❌❌✅ 1.1.1变量提升的例子 在 JavaScript 中,var 声明的变量会存在变量提升的现象,而 let 和 const 则不会。变量提升是指变量的声…

使用 Go 构建 MCP Server

一个互联网技术玩家,一个爱聊技术的家伙。在工作和学习中不断思考,把这些思考总结出来,并分享,和大家一起交流进步。 一、MCP 介绍 1. 基本介绍 MCP(Model Context Protocol,模型上下文协议)是…

线程池实现学习笔记1

线程池实现学习笔记 今天花了一些时间学习和实现了线程池,收获颇丰。在这里记录一下自己的学习心得,希望对大家也有帮助。 为什么需要线程池? 在实际开发中,如果每个任务都创建一个新线程,当任务数量很大时会带来以…

CES Asia 2025赛逸展:科技浪潮中的创新与商贸盛会

在科技发展日新月异的当下,CES Asia 2025第七届亚洲消费电子技术贸易展(赛逸展)正积极筹备,将在北京举办,有望成为亚洲消费电子领域极具影响力的年度盛会。作为亚洲科技领域的重要展会,此次得到了数十家电子…

架构设计之自定义延迟双删缓存注解(上)

架构设计之自定义延迟双删缓存注解(上) 小薛博客官方架构设计之自定义延迟双删缓存注解(上)地址 1、业务场景问题 在多线程并发情况下,假设有两个数据库修改请求,为保证数据库与redis的数据一致性,修改请求的实现中需要修改数据库后&#…

Windows桌面采集技术

在进入具体的方式讨论前,我们先看看 Windows 桌面图形界面的简化架构,如下图: 在 Windows Vista 之前,Windows 界面的复合画面经由 Graphics Device Interface(以下简称 GDI)技术直接渲染到桌面上。 在 Wi…

ElementPlus 快速入门

目录 前言 为什么要学习 ElementPlus? 正文 步骤 1 创建 一个工程化的vue 项目 ​2 安装 element-Plus :Form 表单 | Element Plus 1 点击 当前界面的指南 2 点击左边菜单栏上的安装,选择包管理器 3 运行该命令 demo(案例1 ) 步骤 …