Python小练习2:pandas.Dataframe使用方法示例demo

pandas.Dataframe使用方法示例demo


本文通过一个实例来介绍pandas.Dataframe的各种常用操作,问题总结并修改自coursera上南京大学的课程:用Python玩转数据。

直接进入正题,我们的示例首先调用matplotlib.finance包中提供的函数quotes_historical_yahoo_ochl,通过雅虎财经提供的api函数得到了微软公司近两年的股票数据,构造成数据框Dataframe的形式。然后对其股票数据进行简单的分析和操作,例如求微软公司2015年每个月股票收盘价的平均值。通过多个类似的问题,涵盖了大多数常用Dataframe操作的练习。

代码如下:(python版本3.5)

"""
Created on Mon Jan 16 17:26:05 2017
练习:
对微软公司股票数据的操作练习
@author: AS
"""from matplotlib.finance import quotes_historical_yahoo_ochl
from datetime import date
import pandas as pd
today = date.today()
start = (today.year-2, today.month, today.day)
quotesMS = quotes_historical_yahoo_ochl('MSFT', start, today) #获取微软两年内的股票数据
attributes=['date','open','close','high','low','volume']      #属性描述
quotesdfMS = pd.DataFrame(quotesMS, columns= attributes)      #构造成DataFrameprint('通过雅虎财经api读取的近两年微软公司的股票数据的前5条')
print(quotesdfMS[:5])list = []
for i in range(0, len(quotesMS)):x = date.fromordinal(int(quotesMS[i][0])) # 转换存储时间的格式,例 735618 转换为 2015-01-20y = date.strftime(x, '%y/%m/%d')  #进一步转换格式list.append(y)
quotesdfMS.index = list  #用转换后的时间变量作为索引
quotesdfMS = quotesdfMS.drop(['date'], axis = 1) #将多余的时间变量剔除print('\n查询在2015年整年内(即1月1日至12月31日)微软股票收盘价最高的5天数据。')
print(quotesdfMS['15/01/01':'15/12/31'].sort('close', ascending=0)[:5])print('\n根据成交量升序排列2015年上半年的微软股票数据,显示前5条')
print(quotesdfMS['15/1/1':'15/5/31'].sort('volume')[:5])print('\n统计在2015年整年内(即1月1日至12月31日)微软股票收盘价每个月的均值')
list = []
quotesdfMS15 = quotesdfMS['15/01/01':'15/12/31'] 
for i in range(0, len(quotesdfMS15)):list.append(int(quotesdfMS15.index[i][3:5])) #时间索引的第3,4个字符对应月份,例如2015-01-20对应月份'01'
quotesdfMS15['month'] = list  #添加一列月份变量
print(quotesdfMS15.groupby('month').mean().close) #根据month分组,求每组所有变量的均值print('\n统计在2015年整年内(即1月1日至12月31日)微软股票涨价的每个月的天数')
list1 = []
tmpdf = quotesdfMS['15/01/01':'15/12/31']
for i in range(0, len(tmpdf)):list1.append(int(tmpdf.index[i][3:5]))
tmpdf['month'] = list1
print(tmpdf[ tmpdf.close > tmpdf.open]['month'].value_counts())print('\n合并在2015年整年内(即1月1日至12月31日)微软股票收盘价最高的5天和最低的5天')
sorted = tmpdf.sort('close')
print(pd.concat([sorted[:5], sorted[len(sorted)-5:]]))


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/499526.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

FreeRTOS学习及移植笔记之二:在IAR和STM32F103VET上移植FreeRTOS

上一次,我们简单的测试了FreeRTOS的基于IAR EWARMv6.4和STM32F103VET6平台的Demo,对其有了一个基本认识。接下来我们开始自己移植FreeRTOS的过程。 1、创建一个“FreeRTOSTestProject”项目文件夹,并在其下创建FreeR…

如何创建一个最简单的Windows桌面应用程序 (C++)

如何创建一个最简单的Windows桌面应用程序 (C) 最近刚开始学习C/C开发Windows应用程序,这里将会以零基础的视角把学习过程完全记录下来。如果你也刚刚起步,那本文一定非常适合你。 进入正题,本文讨论如何使用Visual Studio生成一个最简单的C窗…

Win32窗体应用程序如何添加资源文件?

Win32窗体应用程序如何添加资源文件? 上一篇文章介绍了:如何创建一个最简单的Windows窗体应用程序。 按照上一篇文章的介绍,我们的HelloApp项目对应如下的窗体应用程序: 这一篇文章中,我们将在这个程序的基础上&#x…

通过数组和枚举简化GPIO操作编码

在工作中,经常遇到大量使用GPIO作为数字量输入输出来控制设备或采集状态,每次定义操作不同的GPIO针脚既麻烦又容易出错,于是就想要简化操作过程。对于数字量输入来说就是采集对应针脚的状态;而输出则是根…

【论文党福利】如何提取图像中的数据

【论文党福利】如何提取图像中的数据 从事科研的老师和同学们在撰写论文时,经常需要将文献中的曲线与自己的结果进行对比,为获取原始数据,最靠谱的方法当然是找原作者要。如果没有要到呢?本文将成为论文党的福利,为你…

添加串口和虚拟终端输出帮助调试

在使用IAR开发STM32项目时,使用串口或者是虚拟终端来输出我们想看的信息是一个非常好而且简便的方式。 首先来看看串口怎么实现信息输出。简单来说串口输出信息就是将标准输出重定向到串口,在上位机的超级终端或者串口助手等工…

1.1股票数据预处理练习

第一阶段、一个简单策略入门量化投资 1.1股票数据预处理练习 无论我们要对股票市场进行何种探索,在开始前,研究如何获取数据,并进行对应的预处理都是必要的。 本节以美股为例,进行股票数据预处理的练习。正文如下: …

1-2 移动均线交叉策略1

第一阶段、一个简单策略入门量化投资 1-2 移动均线交叉策略1 第一阶段一个简单策略入门量化投资1-2 移动均线交叉策略1前言获取数据移动均线交叉策略数据可视化绘制折线图绘制K线图绘制移动均线 移动均线交叉策略回测什么是回测回溯买卖信号计算收益 未完待续完整代码 前言 …

STM32F412应用开发笔记之一:初识NUCLEO-F412ZG

今天终于收到了期待已久的NUCLEO-F412ZG,感谢电子发烧友论坛! 近几年来基本都是在STM32平台上做一些设计开发工作。STM32F103、STM32F107、STM32F429等都应用过,但却从没有申请过试用。没想到这次申请居然能被选中&a…

STM32F412应用开发笔记之二:基本GPIO控制

NUCLEO-F412ZG板子上的元器件并没有完全焊接,除去ST-LINK部分和电源部分后,还有用一个USB主机接口,三个LED灯和两个按钮,不过很多功能引脚都已经引到了插针。查看原理图可发现,由原理图模块的…

1-3移动均线交叉策略2

第一阶段、一个简单策略入门量化投资 1-3移动均线交叉策略2 上一篇文章1-2 移动均线交叉策略1中我们最后提到: 如果我们从第一天买入股票,一直持有股票,最后一天卖出,获得的收益是每股124.02美元,收益率为412% 如果…

1-4移动均线交叉策略3

第一阶段、一个简单策略入门量化投资 1-4移动均线交叉策略3 上一文1-3移动均线交叉策略2中,我们得到的结果是令人失望的。但我们的探索还要继续。 我们知道,使用投资组合的方式进行分散投资是降低风险的好办法。尽管移动均线交叉策略的表现并不理想&a…

STM32学习及应用笔记一:SysTick定时器学习及应用

 这几年一直使用STM32的MCU,对ARM内核的SysTick计时器也经常使用,但几乎没有仔细了解过。最近正好要在移植一个新的操作系统时接触到了这块,据比较深入的了解了一下。 1、SysTick究竟是什么? 关于SysT…

使用Atom快速打造好用的Markdown编辑器

使用Atom快速打造好用的Markdown编辑器 Atom当前主流的跨平台的三大编辑器(Atom,sublime,vscode)之一 今天尝试了使用Atom来打造Markdown编辑器,快速上手且易用,墙裂推荐! 下面直接进入正题,一步步介绍如何使用Atom快速打造好用…

PID控制器开发笔记之一:PID算法原理及基本实现

 在自动控制中,PID及其衍生出来的算法是应用最广的算法之一。各个做自动控制的厂家基本都有会实现这一经典算法。我们在做项目的过程中,也时常会遇到类似的需求,所以就想实现这一算法以适用于更多的应用场景。…

十分钟能学会的简单python爬虫

简单爬虫三步走,So easy~ 本文介绍一个使用python实现爬虫的超简单方法,精通爬虫挺难,但学会实现一个能满足简单需求的爬虫,只需10分钟,往下读吧~ 该方法不能用于带有反爬机制的页面,但对于我这样的非专业…

PID控制器开发笔记之二:积分分离PID控制器的实现

前面的文章中,我们已经讲述了PID控制器的实现,包括位置型PID控制器和增量型PID控制器。但这个实现只是最基本的实现,并没有考虑任何的干扰情况。在本节及后续的一些章节,我们就来讨论一下经典PID控制器的优化与改进。这一节我们首…

利用python实现短信和电话提醒功能

有时候,我们需要程序帮我们自动检测某些事件的发生 这个需求是广泛存在的 因此,这里整理了利用python实现短信和电话提醒功能的方法 主要需要完成以下4个步骤: - 安装核心库:twilio - 注册账号及配置 - 发送短信示例 - 电话…

PID控制器开发笔记之三:抗积分饱和PID控制器的实现

积分作用的引入是为了消除系统的静差,提高控制精度。但是如果一个系统总是存在统一个方向的偏差,就可能无限累加而进而饱和,极大影响系统性能。抗积分饱和就是用以解决这一问题的方法之一。这一节我们就来实现抗积分饱和的PID算法。 1、抗积…

Git 忽略编译后文件

当我们第一次对某个Git仓库中的项目进行编译后,未追踪的文件通常有两类。 一类是项目新增但还未提交的文件, 另一类是像 .pyc、.obj、.exe 等编译后的二进制文件。 显然前者应该出现在 git status 的输出中,而后者会让我们困惑究竟发生了什…