python实战讲解_Python数据可视化实战讲解

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

开运张 | 作者

知乎专栏 | 来源

三个步骤:确定问题,选择图形

转换数据,应用函数

参数设置,一目了然

首先对时段进行分析第一步

提出问题:租赁总量对应湿度的变化趋势

适合图形:因为湿度属于连续性数值变量,我们可以选择折线图反应变化趋势第二步

转换数据:我们需要一个二维数据框,按照温度变化排序,取对应的三个租赁数的平均值

应用函数:直接应用plt的plot函数即可完成折线图

workingday_df = Bikedata[Bikedata['workingday']==1]#t

workingday_df = workingday_df.groupby(['hour'],as_index=True).agg({'count':'mean','registered':'mean','casual':'mean'})

nworkingday_df = Bikedata[Bikedata['workingday']==0]

nworkingday_df = nworkingday_df.groupby(['hour'],as_index=True).agg({'count':'mean','registered':'mean','casual':'mean'})

nworkingday_df.head()

第三步:设置参数

figure,axes = plt.subplots(1,2,sharey=True)#设置一个1*2的画布,且共享y轴

workingday_df.plot(figsize=(15,5),title='The average number of rentals initiated per hour in the working day',ax=axes[0])

nworkingday_df.plot(figsize=(15,5),title='The average number of rentals initiated per hour in the nworking day',ax=axes[1])

可以看出:在工作日,会员出行对应两个很明显的早晚高峰期,并且在中午会有一个小的高峰,可能对应中午外出就餐需求;

工作日非会员用户出行高峰大概在下午三点;

工作日会员出行次数远多于非会员用户;

在周末,总体出行趋势一致,大部分用车发生在11-5点这段时间,早上五点为用车之最。

对温度进行分析第一步

提出问题:租赁总量对应湿度的变化趋势

适合图形:因为湿度属于连续性数值变量,我们可以选择折线图反应变化趋势第二步

转换数据:我们需要一个二维数据框,按照温度变化排序,取对应的三个租赁数的平均值

应用函数:直接应用plt的plot函数即可完成折线图第三步

参数设置:只需要设置折线图的标题,其他参数默认

temp_df = Bikedata.groupby(['temp'],as_index='True').agg({'count':'mean','registered':'mean','casual':'mean'})

temp_df.plot(title = 'The average number of rentals initiated per hour changes with the temperature')

随着温度的升高,租赁数量呈上升趋势;

在温度达到35度时,因天气炎热,总体数量开始下降;

在温度在4度时,租赁数达到最低点;

湿度对租赁数量的影响第一步

提出问题:租赁总量对应湿度的变化趋势

适合图形:因为湿度属于连续性数值变量,我们可以选择折线图反应变化趋势第二步

转换数据:我们需要一个二维数据框,按照温度变化排序,取对应的三个租赁数的平均值

应用函数:直接应用plt的plot函数即可完成折线图第三步

参数设置:只需要设置折线图的标题,其他参数默认

humidity_df = Bikedata.groupby(['humidity'],as_index=True).agg({'count':'mean','registered':'mean','casual':'mean'})

humidity_df.plot(title='Average number of rentals initiated per hour in different humidity')

可以观察到在湿度20左右租赁数量迅速达到高峰值,此后缓慢递减。

年份,月份和季节作图方法类似,都采用折线图绘制,这里省略。

查看不同天气对出行情况的影响第一步

提出问题:租赁总量对应湿度的变化趋势

适合图形:因为天气情况属于数值型分类变量,我们可以选择柱形图观察数量分布第二步

转换数据:我们需要一个二维数据框,按照天气情况对租赁数量取平均值

应用函数:应用plt的plot.bar函数绘制组合柱形图第三步

参数设置:只需要设置折线图的标题,其他参数默认

weather_df = Bikedata.groupby(['weather'],as_index=True).agg({'registered':'mean','casual':'mean'})

weather_df.plot.bar(stacked=True,title='Average number of rentals initiated per hour in different weather')

观察到天气等级为4时,平均出行人数比天气等级为2是还要高,这不符合常理

我们查看一下天气等级为4的详细情况

count_weather = Bikedata.groupby('weather')

count_weather[['casual','registered','count']].count()

天气状况为4级的只有一天,我们把数据打印出来查看一下

Bikedata[Bikedata['weather']==4]

时间为工作日的下午六点钟,属于晚高峰异常数据,不具有代表性。

会员用户和临时用户在整体用户中占比第一步

提出问题:查看会员用户和临时用户在整体用户中的比例

适合图形:查看占比,适合用饼图pie第二步

转换数据:需要一个二维数据框,按天数取两种用户的平均值

应用函数:应用plt的plot.pie函数绘制饼图第三步

参数设置:这是数据标签和类别标签

#考虑到相同日期是否工作日,星期几,以及所属年份等信息是一样的,把租赁数据按天求和,其它日期类数据取平均值

day_df = Bikedata.groupby(['date'], as_index=False).agg({'casual':'sum','registered':'sum','count':'sum', 'workingday':'mean','weekday':'mean','holiday':'mean','year':'mean'})

day_df.head()

#按天取两种类型用户平均值

number_pei=day_df[['casual','registered']].mean()

number_pei

casual 517.411765

registered 2171.067031

dtype: float64

#绘制饼图

plt.axes(aspect='equal')

plt.pie(number_pei, labels=['casual','registered'], autopct='%1.1f%%', pctdistance=0.6 , labeldistance=1.05 , radius=1 )

plt.title('Casual or registered in the total lease')

Text(0.5,1,'Casual or registered in the total lease')

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/507619.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2018计算机专业考研报名人数,2018年全国考研报考人数、各省市考研报考人数、历年考研录取率、全日制及非全日制硕士研究生比例及考研动机分析【图】...

一、考研报考人数、录取率及报录比分析从上世纪末开始,研究生和本科生招生数量一样在逐步增多。本科扩招的同时,研究生也在扩招。1999年,全国报考研究生人数31.9万,录取人数7.3万,录取率22.8%。2008年,报考…

标记分布学习与标记增强

1 标记增强 标记增强是指将训练样本中的原始逻辑标记转化为标记分布的过程. 与基于嵌入 (embedding) 的 多标记分类方法相似, 标记增强也同样依赖于对隐含在训练样本中的标记相关信息的挖掘.

学python开发必须要会wsgi么_python Web开发你要理解的WSGI uwsgi详解

WSGI协议首先弄清下面几个概念:WSGI:全称是Web Server Gateway Interface,WSGI不是服务器,python模块,框架,API或者任何软件,只是一种规范,描述web server如何与web application通信…

用计算机怎样搜wifi网,笔记本电脑搜索不到无线网络(Wifi)怎么办

在使用Windows 10工作时会遇到形形色色的问题,比如笔记本电脑搜索不到无线网络。那么如何排除故障呢?下面小编与你分享具体步骤和方法。工具/材料Windows 10操作系统操作方法第1:启动Windows 10操作系统,如图所示。点击任务栏&quo…

如何理解矩阵对矩阵求导?

给一种不严密但有用的理解方式: 1 向量的“倒数” 记向量x(x1,x2,…,xn)T\mathrm{x} (x_1, x_2, \dots, x_n)^Tx(x1​,x2​,…,xn​)T,其倒数记为:x−1(1x1,1x2,…,1xn)T\mathrm{x}^{-1} (\frac{1}{x_1}, \frac{1}{x_2}, \dots, \frac{1}…

python获取id标签对应数据_Python--Scrapy爬虫获取简书作者ID的全部文章列表数据

最近Python大火,为了跟上时代,试着自学了下。Scrapy是一个高级的Python爬虫框架,它不仅包含了爬虫的特性,还可以方便的将爬虫数据保存到csv、json等文件中。今天我们就试着用Scrapy来爬取简书某位作者的全部文章。在本篇教程中,我们假定您已经…

怎么用计算机杀毒,电脑怎样查杀病毒

病毒往往会利用计算机操作系统的弱点进行传播,那么大家知道电脑怎样查杀病毒吗?接下来大家跟着学习啦小编一起来了解一下电脑查杀病毒的解决方法吧。电脑查杀病毒方法一一、使用杀毒软件进行杀毒1、首先进入“安全模式”2、进入方法:开机在进入Windows系…

MSN-LDL论文修改(B-Y Rong20211012)

Multi-view label distributed learning with multiple sub-networks –> Multi-view label distribution learning with multiple sub-networks Zhang HengRu1[00000 11111 22222 3333], Rong –> Bin-Yuan Rong, Heng-Ru Zhang Label distribution learning is an em…

将文件中所有数读到一个数组中_「数据结构与算法」将5个文件中的一千万年龄合并到一个新文件中...

现在有5个文件,文件里面分别存储着1千万个用户年龄,并且每个文件中的年龄都是有序的(从小到大),现在需要将这5个文件整合到一个文件中,新文件的内容依然要保持有序(从小到大)。初始化…

成都理工大学工程技术学院计算机专业收分线,2019年成都理工大学工程技术学院美术类专业录取分数线...

四川:艺术本科省控线文化分370专业分200(单科成绩均不低于60分),录取最低专业分224;艺专省控线文化分140专业分160,录取最低专业分181。内蒙古:艺术本科省控线文化分279专业分199,录取最低专业分201&#x…

如何利用python语言实现对象数组

1 Java代码示例 //定义一个类 class Triple {int user;int item;double rating; &#xff5d;//声明对象数组 Triple[] dataset new Triple[20];//利用对象数组访问成员变量 for(int i 0; i < dataset.length; i ){dataset[i].user 0; dataset[i].item 0dataset[i].…

在python中、正确的函数定义格式为_Python函数的定义与实现

1. 函数的介绍函数是 实现具有特定功能的代码块Python中预制了许多内置函数&#xff0c;也可以根据自己的需求创建自定义的函数隐藏实现功能的细节代码的复用提高可读性&#xff0c;便与调试def 函数名(形参1, 形参2...):要运行的代码块(函数体)return 返回的数据(返回值)函数名…

计算机连接交换机配置命令,[计算机]交换机配置命令.doc

[计算机]交换机配置命令交换机配置命令集锦1、 进入全局配置模式1、Switch-3548 > enablePassword : ********Switch-3548 # config tSwitch-3548 (config) #2、 启用交换机的HTTP Server2、Switch-3548 (config) # ip http server3、 配置主机名3、Switch-3548 (config) # …

二维码编码规范解读

1 QR码符号的结构 QR 码符号的结构如下&#xff1a; 1.1 定位图案 Position Detection Pattern是定位图案&#xff0c;用于标记二维码的矩形大小。这三个定位图案有白边叫Separators for Postion Detection Patterns。之所以三个而不是四个意思就是三个就可以标识一个矩形了…

最早单机的计算机操作系统,川农《计算机操作系统(本科)》19年12月在线作业【满分答案】...

可做奥鹏全部院校作业论文&#xff01;答案请添加qq&#xff1a;599792222 或 微信&#xff1a;1095258436川农《计算机操作系统(本科)》19年12月在线作业【满分答案】试卷总分:100 得分:100一、单选题 (共 20 道试题,共 100 分)1.在单一处理机上执行程序&#xff0c;多道程序…

pythonopencv提取圆内图像_python – 使用OpenCV从图像中提取多边形给定...

使用cv2.fillConvexPoly以便您可以指定2D点阵列并定义一个蒙版,该蒙版填充由这些点定义的形状在蒙版中为白色.如果多边形中定义的点是凸的(因此名称为fillConvexPoly),则应该进行一些公平的警告.然后我们可以将其转换为布尔蒙版,并使用它来索引图像以提取出您想要的像素.下面的…

二维码的纠错码原理及如何纠错(1)

本文将通过例子来说明两个方面的内容&#xff1a; &#xff08;1&#xff09;如何构建纠错码&#xff1f; &#xff08;2&#xff09;有了纠错码之后如何纠错&#xff1f; 1 如何构建纠错码&#xff1f; 直接上例子&#xff0c;“hello world” 利用二维码的编码原理&#xf…

浙江省二级计算机vfp,浙江省计算机2级vfp程序调试真题集.doc

程序填空(改错)题&#xff1a;在考生文件夹的paper 子文件夹中&#xff0c;已有文件Modify.prg&#xff0c;请自己打开文件&#xff0c;在标记&&之前填写所缺代码、调试、保存&#xff0c;并完成以下功能1、显示指定表中的全部字段名&#xff0c;并由用户输入显示表信息…

利用自己构建的网络进行鼾声识别

1 目前的工作 1.1 数据 5692条3s且采集率为8000hz的鼾声与6824条3s且采集率为8000hz的其他类音频。通过FFT频谱转换为300个(30,513,1)的矩阵。训练集与测试集的比例为9&#xff1a;1。数据集来源为google开源的数据集。 1.2 模型 图1. The proposed deep neural network arc…

计算机组成码距,计算机组成原理:2.3.2 纠错码原理.ppt

2.3.2 纠错码的基本原理;重复码;;n4时;译码失败&#xff1a;译码器根据接收到的信号无法作出明确判断;纠错码如何纠正错误&#xff1f;;2.3.3 几个基本概念;许用码组和禁用码组;错误图样;汉明距离和重量;最小码距;分组码 分组码一般可用(n,k)表示。其中&#xff0c;k是每组二进…