140种Python标准库、第三方库和外部工具都有了

导读:Python数据工具箱涵盖从数据源到数据可视化的完整流程中涉及到的常用库、函数和外部工具。其中既有Python内置函数和标准库,又有第三方库和工具。

这些库可用于文件读写、网络抓取和解析、数据连接、数清洗转换、数据计算和统计分析、图像和视频处理、音频处理、数据挖掘/机器学习/深度学习、数据可视化、交互学习和集成开发以及其他Python协同数据工作工具。

 

作者:宋天龙  来源:大数据(ID:hzdashuju)

 

为了区分不同对象的来源和类型,本文将在描述中通过以下方法进行标识:

 

  • Python内置函数:Python自带的内置函数。函数无需导入,直接使用。例如要计算-3.2的绝对值,直接使用abs函数,方法是

 

abs(-3.2) 

 

  • Python标准库:Python自带的标准库。Python标准库无需安装,只需要先通过import方法导入便可使用其中的方法。例如导入string模块,然后使用其中的find方法:

import stringstring.find('abcde','b')
  • 第三方库:Python的第三方库。这些库需要先进行安装(部分可能需要配置)。

 

  • 外部工具:非Python写成的库或包,用于Python数据工作的相关工具。

 

推荐度」3星最高,1星最低。

 

 

01 文件读写

 

文件的读写包括常见的txt、Excel、xml、二进制文件以及其他格式的数据文本,主要用于本地数据的读写。

 

 

1. open(name[, mode[, buffering]])

 

  • 类型:Python内置函数

  • 描述:Python默认的文件读写方法

  • 推荐度:★★★

 

2. numpy.loadtxt、numpy.load和numpy.fromfile

 

  • 类型:第三方库

  • 描述:Numpy自带的读写函数,包括loadtxt、load和fromfile,用于文本、二进制文件读写

  • 推荐度:★★★

 

3. pandas.read_*

 

  • 类型:第三方库

  • 描述:Pandas自带的read文件方法,例如ead_csv、read_fwf、read_table等,用于文本、Excel、二进制文件、HDF5、表格、SAS文件、SQL数据库、Stata文件等的读写

  • 推荐度:★★★

 

4. xlrd

 

  • 类型:第三方库

  • 描述:用于Excel文件读取

  • 推荐度:★★

 

5. xlwt

 

  • 类型:第三方库

  • 描述:用于Excel文件写入

  • 推荐度:★★

 

6. pyexcel-xl

 

  • 类型:第三方库

  • 描述:用于Excel文件读写

  • 推荐度:★★

 

7. xluntils

 

  • 类型:第三方库

  • 描述:用于Excel文件读写

  • 推荐度:★★

 

8. pyExcelerator

 

  • 类型:第三方库

  • 描述:用于Excel文件读写

  • 推荐度:

 

9. openpyxl

 

  • 类型:第三方库

  • 描述:用于Excel文件读写

  • 推荐度:

 

10. lxml

 

  • 类型:第三方库

  • 描述:xml和HTML读取和解析

  • 推荐度:★★★

 

11. xml

 

  • 类型:Python标准库

  • 描述:xml对象解析和格式化处理

  • 推荐度:★★★

 

12. libxml2

 

  • 类型:第三方库

  • 描述:xml对象解析和格式化处理

  • 推荐度:

 

13. xpath

 

  • 类型:第三方库

  • 描述:xml对象解析和格式化处理

  • 推荐度:★★

 

14. win32com

 

  • 类型:第三方库

  • 描述:有关Windows系统操作、Office(Word、Excel等)文件读写等的综合应用库

  • 推荐度:

 

 

02 网络抓取和解析

 

网络抓取和解析用于从互联网中抓取信息,并对HTML对象进行处理,有关xml对象的解析和处理的库在“01 文件读写”中找到。

 

 

15. requests

 

  • 类型:第三方库

  • 描述:网络请求库,提供多种网络请求方法并可定义复杂的发送信息

  • 推荐度:★★★

 

16. urllib

 

  • 类型:Python标准库

  • 描述:Python自带的库,简单的读取特定URL并获得返回的信息

  • 推荐度:★★

 

17. urllib2

 

  • 类型:Python标准库

  • 描述:Python自带的库,读取特定URL并获得返回的信息,相对于urllib可处理更多HTTP信息,例如cookie、身份验证、重定向等

  • 推荐度:★★

 

18. urlparse

 

  • 类型:Python标准库

  • 描述:Python自带的URL解析库,可自动解析URL不同的域、参数、路径等

  • 推荐度:★★★

 

19. HTMLParser

 

  • 类型:Python标准库

  • 描述:Python自带的HTML解析模块,能够很容易的实现HTML文件的分析

  • 推荐度:★★★

 

20. Scapy

 

  • 类型:第三方库

  • 描述:分布式爬虫框架,可用于模拟用户发送、侦听和解析并伪装网络报文,常用于大型网络数据爬取

  • 推荐度:★★★

 

21. Beautiful Soup

 

  • 类型:第三方库

  • 描述:Beautiful Soup是网页数据解析和格式化处理工具,通常配合Python的urllib、urllib2等库一起使用

  • 推荐度:★★★

 

 

03 数据库连接

 

数据库连接可用于连接众多数据库以及访问通用数据库接口,可用于数据库维护、管理和增、删、改、查等日常操作。

 

 

22. mysql-connector-python

 

  • 类型:第三方库

  • 描述:MySQL官方驱动连接程序

  • 推荐度:★★★

 

23. pymysql

 

  • 类型:第三方库

  • 描述:MySQL连接库,支持Python3

  • 推荐度:★★★

 

24. MySQL-python

 

  • 类型:第三方库

  • 描述:MySQL连接库

  • 推荐度:★★

 

25. cx_Oracle

 

  • 类型:第三方库

  • 描述:Oracle连接库

  • 推荐度:★★★

 

26. psycopg2

 

  • 类型:第三方库

  • 描述:Python编程语言中非常受欢迎的PostgreSQL适配器

  • 推荐度:★★★

 

27. redis

 

  • 类型:Python标准库

  • 描述:Redis连接库

  • 推荐度:★★★

 

28. pymongo

 

  • 类型:第三方库

  • 描述:MongoDB官方驱动连接程序

  • 推荐度:★★★

 

29. HappyBase

 

  • 类型:第三方库

  • 描述:HBase连接库

  • 推荐度:★★★

 

30. py2neo

 

  • 类型:第三方库

  • 描述:Neo4j连接库

  • 推荐度:★★★

 

31. cassandra-driver

 

  • 类型:第三方库

  • 描述:Cassandra(1.2+)和DataStax Enterprise(3.1+)连接库

  • 推荐度:★★★

 

32. sqlite3

 

  • 类型:Python标准库

  • 描述:Python自带的模块,用于操作SQLite数据库

  • 推荐度:★★★

 

33. pysqlite2

 

  • 类型:第三方库

  • 描述:SQLite 3.x连接库

  • 推荐度:★★

 

34. bsddb3

 

  • 类型:第三方库

  • 描述:Berkeley DB连接库

 

35. bsddb

 

  • 类型:Python标准库

  • 描述:Python自带的模块,提供了一个到Berkeley DB库的接口

  • 推荐度:★★

 

36. dbhash

 

  • 类型:Python标准库

  • 描述:Python自带的模块,dbhash模块提供了使用BSD数据库库打开数据库的功能。该模块镜像了提供对DBM样式数据库访问的其他Python数据库模块的接口。bsddb模块需要使用dbhash

  • 推荐度:★★

 

37. adodb

 

  • 类型:第三方库

  • 描述:ADOdb是一个数据库抽象库,支持常见的数据和数据库接口并可自行进行数据库扩展,该库可以对不同数据库中的语法进行解析和差异化处理,具有很高的通用性

  • 推荐度:★★★

 

38. SQLObject

 

  • 类型:第三方库

  • 描述:SQLObject是一种流行的对象关系管理器,用于向数据库提供对象接口,其中表为类、行为实例、列为属性

  • 推荐度:★★

 

39. SQLAlchemy

 

  • 类型:第三方库

  • 描述:SQLAlchemy是Python SQL工具包和对象关系映射器,为应用程序开发人员提供了SQL的全部功能和灵活性控制

  • 推荐度:★★

 

40. ctypes

 

  • 类型:第三方库

  • 描述:ctypes是Python的一个外部库,提供和C语言兼容的数据类型,可以很方便地调用C DLL中的函数

  • 推荐度:★★★

 

41. pyodbc

 

  • 类型:第三方库

  • 描述:Python通过ODBC访问数据库的接口库

  • 推荐度:★★★

 

42. Jython

 

  • 类型:第三方库

  • 描述:Python通过JDBC访问数据库的接口库

  • 推荐度:★★★

 

 

04 数据清洗转换

 

数据清洗转换主用于数据正式应用之前的预处理工作。

 

 

43. frozenset([iterable])

 

  • 类型:Python内置函数

  • 描述:返回一个新的frozenset对象,可选择从iterable取得的元素

  • 推荐度:★★★

 

44. int(x)

 

  • 类型:Python内置函数

  • 描述:返回x的整数部分

  • 推荐度:★★★

 

45. isinstance(object, classinfo)

 

  • 类型:Python内置函数

  • 描述:返回object是否是指定的classinfo实例信息

  • 推荐度:★★★

 

46. len(s)

 

  • 类型:Python内置函数

  • 描述:返回对象的长度或项目数量

  • 推荐度:★★★

 

47. long(x)

 

  • 类型:Python内置函数

  • 描述:返回由字符串或数字x构造的长整型对象

  • 推荐度:★★★

 

48. max(iterable[, key])

 

  • 类型:Python内置函数

  • 描述:返回一个可迭代或最大的两个或多个参数中的最大项

  • 推荐度:★★★

 

49. min(iterable[, key])

 

  • 类型:Python内置函数

  • 描述:返回一个可迭代或最大的两个或多个参数中的最小项

  • 推荐度:★★★

 

50. range(start, stop[, step])

 

  • 类型:Python内置函数

  • 描述:用于与for循环一起创建循环列表,通过指定start(开始)、stop(结束)和step(步长)控制迭代次数并获取循环值

  • 推荐度:★★★

 

51. raw_input(prompt)

 

  • 类型:Python内置函数

  • 描述:捕获用户输入并作为字符串返回(不推荐使用input作为用户输入的捕获函数)

  • 推荐度:★★★

 

52. round(number[, ndigits])

 

  • 类型:Python内置函数

  • 描述:返回number小数点后ndigits位的四舍五入的浮点数

  • 推荐度:★★★

 

53. set([iterable])

 

  • 类型:Python内置函数

  • 描述:返回一个新的集合对象,可选择从iterable获取的元素

  • 推荐度:★★★

 

54. slice(start, stop[, step])

 

  • 类型:Python内置函数

  • 描述:返回表示由范围(start、stop、step)指定的索引集的切片对象

  • 推荐度:★★

 

55. sorted(iterable[, cmp[, key[, reverse]]])

 

  • 类型:Python内置函数

  • 描述:从iterable的项中返回一个新的排序列表

  • 推荐度:★★★

 

56. xrange(start, stop[, step])

 

  • 类型:Python内置函数

  • 描述:此函数与range()非常相似,但返回一个xrange对象而不是列表

  • 推荐度:★★★

 

57. string

 

  • 类型:Python标准库

  • 描述:字符串处理库,可实现字符串查找、分割、组合、替换、去重、大小写转换及其他格式化处理

  • 推荐度:★★★

 

58. re

 

  • 类型:Python标准库

  • 描述:正则表达式模块,在文本和字符串处理中经常使用

  • 推荐度:★★★

 

59. random

 

  • 类型:Python标准库

  • 描述:该模块为各种分布实现伪随机数生成器,支持数据均匀分布、正态(高斯)分布、对数正态分布、负指数分布、伽马和β分布等

  • 推荐度:★★★

 

60. os

 

  • 类型:Python标准库

  • 描述:用于新建、删除、权限修改、切换路径等目录操作,以及调用执行系统命令

  • 推荐度:★★★

 

61. os.path

 

  • 类型:Python标准库

  • 描述:针对目录的遍历、组合、分割、判断等操作,常用于数据文件的判断、查找、合并

  • 推荐度:★★★

 

62. prettytable

 

  • 类型:Python标准库

  • 描述:格式化表格输出模块

  • 推荐度:★★

 

63. json

 

  • 类型:Python标准库

  • 描述:Python对象与json对象的转换

  • 推荐度:★★★

 

64. base64

 

  • 类型:Python标准库

  • 描述:将任意二进制字符串编码和解码为文本字符串的Base16,Base32和Base64

  • 推荐度:★★★

 

 

05 数据计算和统计分析

 

数据计算和统计分析主要用于数据探查、计算和初步数据分析等工作。

 

 

65. numpy

 

  • 类型:第三方库

  • 描述:NumPy是Python科学计算的基础工具包,很多Python数据计算工作库都依赖它

  • 推荐度:★★★

 

66. scipy

 

  • 类型:第三方库

  • 描述:Scipy是一组专门解决科学和工程计算不同场景的主题工具包

  • 推荐度:★★★

 

67. pandas

 

  • 类型:第三方库

  • 描述:Pandas是一个用于Python数据分析的库,它的主要作用是进行数据分析。Pandas提供用于进行结构化数据分析的二维的表格型数据结构DataFrame,类似于R中的数据框,能提供类似于数据库中的切片、切块、聚合、选择子集等精细化操作,为数据分析提供了便捷

  • 推荐度:★★★

 

68. statsmodels

 

  • 类型:第三方库

  • 描述:Statsmodels是Python的统计建模和计量经济学工具包,包括一些描述性统计、统计模型估计和统计测试,集成了多种线性回归模型、广义线性回归模型、离散数据分布模型、时间序列分析模型、非参数估计、生存分析、主成分分析、核密度估计以及广泛的统计测试和绘图等功能

  • 推荐度:★★★

 

69. abs(x)

 

  • 类型:Python内置函数

  • 描述:返回x的绝对值

  • 推荐度:★★★

 

70. cmp(x, y)

 

  • 类型:Python内置函数

  • 描述:比较两个对象x和y,并根据结果返回一个整数。如果x <y,则返回值为负数,如果x == y则为零,如果x> y则返回值为正

  • 推荐度:★★

 

71. float(x)

 

  • 类型:Python内置函数

  • 描述:返回从数字或字符串x构造的浮点数

  • 推荐度:★★★

 

72. pow(x, y[, z])

 

  • 类型:Python内置函数

  • 描述:返回x的y次幂。如果z存在,则返回x的y次幂,模z

  • 推荐度:★★★

 

73. sum(iterable[, start])

 

  • 类型:Python内置函数

  • 描述:从左到右依次迭代,返回总和

  • 推荐度:★★★

 

74. math

 

  • 类型:Python标准库

  • 描述:数学函数库,包括正弦、余弦、正切、余切、弧度转换、对数运算、圆周率、绝对值、取整等数学计算方法

  • 推荐度:★★★

 

75. cmath

 

  • 类型:Python标准库

  • 描述:与math基本一致,区别是cmath运算的是复数

  • 推荐度:★★

 

76. decimal

 

  • 类型:Python标准库

  • 描述:10进制浮点运算

  • 推荐度:★★

 

77. fractions

 

  • 类型:Python标准库

  • 描述:分数模块提供对有理数算术的支持

  • 推荐度:★★

 

 

06 自然语言处理和文本挖掘

 

自然语言处理和文本挖掘库主要用于以自然语言文本为对象的数据处理和建模。

 

 

78. nltk

 

  • 类型:第三方库

  • 描述:NLTK是一个Python自然语言处理工具,它用于对自然语言进行分类、解析和语义理解。目前已经有超过50种语料库和词汇资源

  • 推荐度:★★★

 

79. pattern

 

  • 类型:第三方库

  • 描述:Pattern是一个网络数据挖掘Python工具包,提供了用于网络挖掘(如网络服务、网络爬虫等)、自然语言处理(如词性标注、情感分析等)、机器学习(如向量空间模型、分类模型等)、图形化的网络分析模型

  • 推荐度:★★★

 

80. gensim

 

  • 类型:第三方库

  • 描述:Gensim是一个专业的主题模型(发掘文字中隐含主题的一种统计建模方法)Python工具包,用来提供可扩展统计语义、分析纯文本语义结构以及检索语义上相似的文档

  • 推荐度:★★★

 

81. 结巴分词

 

  • 类型:第三方库

  • 描述:结巴分词是国内流行的Python文本处理工具包,分词模式分为三种模式:精确模式、全模式和搜索引擎模式,支持繁体分词、自定义词典等,是非常好的Python中文分词解决方案,可以实现分词、词典管理、关键字抽取、词性标注等

  • 推荐度:★★★

 

82. SnowNLP

 

  • 类型:第三方库

  • 描述:SnowNLP是一个Python写的类库,可以方便的处理中文文本内容。该库是受到了TextBlob的启发而针对中文处理写的类库,和TextBlob不同的是这里没有用NLTK,所有的算法都是自己实现的,并且自带了一些训练好的字典

  • 推荐度:★★

 

83. smallseg

 

  • 类型:第三方库

  • 描述:Smallseg是一个开源的、基于DFA的轻量级的中文分词工具包。可自定义词典、切割后返回登录词列表和未登录词列表、有一定的新词识别能力

  • 推荐度:★★

 

84. spaCy

 

  • 类型:第三方库

  • 描述:spaCy是一个Python自然语言处理工具包,它结合Python和Cython使得自然语言处理能力达到了工业强度

  • 推荐度:★★★

 

85. TextBlob

 

  • 类型:第三方库

  • 描述:TextBlob 是一个处理文本数据的Python库,可用来做词性标注、情感分析、文本翻译、名词短语抽取、文本分类等

  • 推荐度:★★

 

86. PyNLPI

 

  • 类型:第三方库

  • 描述:PyNLPI是一个适合各种自然语言处理任务的集合库,可用于中文文本分词、关键字分析等,尤其重要的是其支持中英文映射,支持UTF-8和GBK编码的字符串等

  • 推荐度:★★★

 

87. synonyms

 

  • 类型:第三方库

  • 描述:中文近义词工具包,可用于自然语言理解的很多任务:文本对齐,推荐算法,相似度计算,语义偏移,关键字提取,概念提取,自动摘要,搜索引擎等。

  • 推荐度:★★★

 

 

07 图像和视频处理

 

图像处理和视频处理主要适用于基于图像的操作、处理、分析和挖掘,如人脸识别、图像识别、目标跟踪、图像理解等。

 

 

88. PIL/Pillow

 

  • 类型:第三方库

  • 描述:PIL是一个常用的图像读取、处理和分析的库,提供了多种数据处理、变换的操作方法和属性。PIL仅支持到2.7版本且已经很久没有更新,一群志愿者基于PIL发布了新的分支Pillow。Pillow同时支持Python2和Python3并且加入很多新的功能

  • 推荐度:★★

 

89. OpenCV

 

  • 类型:第三方库

  • 描述:OpenCV是一个强大的图像和视频工作库。它提供了多种程序接口,支持跨平台(包括移动端)应用。OpenCV的设计效率很高,它以优化的C / C ++编写,库可以利用多核处理。除了对图像进行基本处理外,还支持图像数据建模,并预制了多种图像识别引擎,如人脸识别

  • 推荐度:★★★

 

90. scikit-image

 

  • 类型:第三方库

  • 描述:scikit-image(也称skimage)是一个图像处理库,支持颜色模式转换、滤镜、绘图、图像处理、特征检测等多种功能

  • 推荐度:★★

 

91. imageop

 

  • 类型:Python标准库

  • 描述:Python自带的函数,对图像基本操作,包括裁剪、缩放、模式转换

  • 推荐度:

 

92. colorsys

 

  • 类型:Python标准库

  • 描述:Python自带的函数,实现不同图像色彩模式的转换

  • 推荐度:

 

93. imghdr

 

  • 类型:Python标准库

  • 描述:Python自带的函数,返回图像文件的类型

  • 推荐度:

 

 

08 音频处理

 

音频处理主要适用于基于声音的处理、分析和建模,主要应用于语音识别、语音合成、语义理解等。

 

 

94. TimeSide

 

  • 类型:第三方库

  • 描述:TimeSide是一个能够进行音频分析、成像、转码、流媒体和标签处理的Python框架,可以对任何音频或视频内容非常大的数据集进行复杂的处理

  • 推荐度:★★★

 

95. audiolazy

 

  • 类型:第三方库

  • 描述:audiolazy是一个用于实时声音数据流处理的库,支持实时数据应用处理、无限数据序列表示、数据流表示等

  • 推荐度:★★

 

96. pydub

 

  • 类型:第三方库

  • 描述:pydub支持多种格式声音文件,可进行多种信号处理(例如压缩、均衡、归一化)、信号生成(例如正弦、方波、锯齿等)、音效注册、静音处理等

  • 推荐度:★★★

 

97. audioop

 

  • 类型:Python标准库

  • 描述:Python自带的函数,可实现对声音片段的一些常用操作

  • 推荐度:★★

 

98. tinytag

 

  • 类型:第三方库

  • 描述:tinytag用于读取多种声音文件的元数据,涵盖MP3、OGG、OPUS、MP4、M4A、FLAC、WMA、Wave等格式

  • 推荐度:★★

 

99. aifc

 

  • 类型:Python标准库

  • 描述:Python自带的函数,读写AIFF和AIFC文件

  • 推荐度:

 

100. sunau

 

  • 类型:Python标准库

  • 描述:Python自带的函数,读写Sun AU文件

  • 推荐度:

 

101. wave

 

  • 类型:Python标准库

  • 描述:Python自带的函数,读写WAV文件

  • 推荐度:★★

 

102. chunk

 

  • 类型:Python标准库

  • 描述:Python自带的函数,读取EA IFF 85块格式的文件

  • 推荐度:

 

103. sndhdr

 

  • 类型:Python标准库

  • 描述:Python自带的函数,返回声音文件的类型

  • 推荐度:

 

104. ossaudiodev

 

  • 类型:Python标准库

  • 描述:该模块支持访问OSS(开放声音系统)音频接口

  • 推荐度:★★★

 

 

09 数据挖掘/机器学习/深度学习

 

数据挖掘、机器学习和深度学习等是Python进行数据建模和挖掘学习的核心模块。

 

 

105. Scikit-Learn

 

  • 类型:第三方库

  • 描述:scikit-learn(也称SKlearn)是一个基于Python的机器学习综合库,内置监督式学习和非监督式学习机器学习方法,包括各种回归、聚类、分类、流式学习、异常检测、神经网络、集成方法等主流算法类别,同时支持预置数据集、数据预处理、模型选择和评估等方法,是一个非常完整、流行的机器学习工具库

  • 推荐度:★★★

 

106. TensorFlow

 

  • 类型:第三方库

  • 描述:TensorFlow 是谷歌的第二代机器学习系统,内建深度学习的扩展支持,任何能够用计算流图形来表达的计算,都可以使用 TensorFlow

  • 推荐度:★★★

 

107. NuPIC

 

  • 类型:第三方库

  • 描述:NuPIC是一个以HTM(分层时间记忆)学习算法为工具的机器智能平台。NuPIC适合于各种各样的问题,尤其适用于检测异常和预测应用

  • 推荐度:★★★

 

108. PyTorch

 

  • 类型:第三方库

  • 描述:PyTorch是FaceBook推出的深度学习框架,它基于Python(而非lua)产生,它提供的动态计算图是显著区别于Tensorflow等其他学习框架的地方。

  • 推荐度:★★

 

109. Orange

 

  • 类型:第三方库

  • 描述:Orange通过图形化操作界面,提供交互式数据分析功能,尤其适用于分类、聚类、回归、特征选择和交叉验证工作

  • 推荐度:★★★

 

110. theano

 

  • 类型:第三方库

  • 描述:Theano是非常成熟的深度学习库。它与Numpy紧密集成,支持GPU计算、单元测试和自我验证

  • 推荐度:★★★

 

111. keras

 

  • 类型:第三方库

  • 描述:Keras是一个用Python编写的高级神经网络API,能够运行在TensorFlow或者Theano之上,它的开发重点是实现快速实验

  • 推荐度:★★

 

112. neurolab

 

  • 类型:第三方库

  • 描述:Neurolab是具有灵活网络配置和Python学习算法的基本神经网络算法库。它包含通过递归神经网络(RNN)实现的不同变体,该库是同类RNN API中最好的选择之一

  • 推荐度:★★

 

113. PyLearn2

 

  • 类型:第三方库

  • 描述:PyLearn2是基于Theano的深度学习库,它旨在提供极大的灵活性,并使研究人员可以进行自由可控制,参数和属性的灵活、开放配置是亮点

  • 推荐度:★★★

 

114. OverFeat

 

  • 类型:第三方库

  • 描述:OverFeat是一个深度学习库,主要用于图片分类、定位物体检测

  • 推荐度:★★

 

115. Pyevolve

 

  • 类型:第三方库

  • 描述:Pyevolve是一个完整的遗传算法框架,也支持遗传编程

  • 推荐度:★★

 

116. Caffe2

 

  • 类型:第三方库

  • 描述:Cafffe2也是FaceBook推出的深度学习框架,相比于PyTorch 更适合于研究,Caffe2 适合大规模部署,主要用于计算机视觉,它对图像识别的分类具有很好的应用效果

  • 推荐度:★★

 

 

10 数据可视化

 

数据可视化主要用于做数据结果展示、数据模型验证、图形交互和探查等方面。

 

 

117. Matplotlib

 

  • 类型:第三方库

  • 描述:Matplotlib是Python的2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形,开发者可以仅需要几行代码,便可以生成多种高质量图形

  • 推荐度:★★★

 

118. pyecharts

 

  • 类型:第三方库

  • 描述:基于百度Echarts的强大的可视化工具库,其提供的图形功能众多,尤其对于复杂关系的展示能力较强

  • 推荐度:★★★

 

119. seaborn

 

  • 类型:第三方库

  • 描述:Seaborn是在Matplotlib的基础上进行了更高级的API封装,它可以作为Matplotlib的补充

  • 推荐度:★★★

 

120. bokeh

 

  • 类型:第三方库

  • 描述:Bokeh是一种交互式可视化库,可以在WEB浏览器中实现美观的视觉效果

  • 推荐度:★★★

 

121. Plotly

 

  • 类型:第三方库

  • 描述:Plotly提供的图形库可以进行在线WEB交互,并提供具有出版品质的图形,支持线图、散点图、区域图、条形图、误差条、框图、直方图、热图、子图、多轴、极坐标图、气泡图、玫瑰图、热力图、漏斗图等众多图形

  • 推荐度:★★★

 

122. VisPy

 

  • 类型:第三方库

  • 描述:VisPy是用于交互式科学可视化的Python库,旨在实现快速,可扩展和易于使用

  • 推荐度:★★

 

123. PyQtGraph

 

  • 类型:第三方库

  • 描述:PyQtGraph是一个建立在PyQt4 / PySide和numpy之上的纯Python图形和GUI库,主要用于数学/科学/工程应用

  • 推荐度:★★

 

124. ggplot

 

  • 类型:第三方库

  • 描述:ggplot是用Python实现的图形输出库,类似于 R中的图形展示版本

  • 推荐度:★★★

 

 

11 交互学习和集成开发

 

交互学习和集成开发主要用来做Python开发、调试和集成之用,包括Python集成开发环境和IDE。

 

 

125. IPython/ Jupyter

 

  • 类型:第三方库

  • 描述:IPython 是一个基于Python 的交互式shell,比默认的Python shell 好用得多,支持变量自动补全、自动缩进、交互式帮助、魔法命令、系统命令等,内置了许多很有用的功能和函数。从IPython4.0开始,IPython衍生出了IPython和Jupyter两个分支。在该分支正式出现之前,IPython其实已经拥有了ipython notebook功能,因此,Jupyter更像是一个ipython notebook的升级版。

  • 推荐度:★★★

 

126. Elpy

 

  • 类型:第三方库

  • 描述:Elpy是Emacs用于Python的开发环境,它结合并配置了许多其他软件包,它们都是用Emacs Lisp和Python编写的

  • 推荐度:★★

 

127. PTVS

 

  • 类型:第三方库

  • 描述:Visual Studio 的 Python 工具

  • 推荐度:★★

 

128. PyCharm

 

  • 类型:外部工具

  • 描述:PyCharm带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具,比如调试、语法高亮、项目管理、代码跳转、智能提示、自动完成、单元测试、版本控制并可集成IPython、系统终端命令行等,在PyCharm里几乎就可以实现所有有关Python工作的全部过程

  • 推荐度:★★★

 

129. LiClipse

 

  • 类型:外部工具

  • 描述:LiClipse是基于Eclipse的免费多语言 IDE,通过其中的PyDev可支持 Python开发应用

  • 推荐度:★★

 

130. Spyder

 

  • 类型:外部工具

  • 描述:Spyder是一个开源的Python IDE,由IPython和众多流行的Python库的支持,是一个具备高级编辑、交互式测试、调试以及数字计算环境的交互式开发环境

  • 推荐度:★★

 

 

12 其他Python协同数据工作工具

 

其他Python协同数据工作工具指除了上述主题以外,其他在数据工作中常用的工具或库。

 

131. tesseract-ocr

 

  • 类型:外部工具

  • 描述:这是一个Google支持的开源OCR图文识别项目,支持超过200种语言(包括中文),并支持自定义训练字符集,支持跨Windows、Linux、Mac OSX 多平台使用

  • 推荐度:★★★

 

132. RPython

 

  • 类型:第三方库

  • 描述:R集成库

  • 推荐度:★★★

 

133. Rpy2

 

  • 类型:第三方库

  • 描述:Python连接R的库

 

134. matpython

 

  • 类型:第三方库

  • 描述:MATLAB集成库

  • 推荐度:★★★

 

135. Lunatic Python

 

  • 类型:第三方库

  • 描述:Lua集成库

  • 推荐度:★★

 

136. PyCall.jl

 

  • 类型:第三方库

  • 描述:Julia集成库

  • 推荐度:★★

 

137. PySpark

 

  • 类型:第三方库

  • 描述:Spark提供的Python API

  • 推荐度:★★★

 

138. dumbo

 

  • 类型:第三方库

  • 描述:这个模块可以让Pythoner轻松的编写和运行 Hadoop 程序,程序版本比较早,可以作为参考

  • 推荐度:★★

 

139. dpark

 

  • 类型:第三方库

  • 描述:Python对Spark的克隆版本,类MapReduce框架

  • 推荐度:★★

 

140. streamparse

 

  • 类型:第三方库

  • 描述:Streamparse允许通过Storm对实时数据流运行Python代码

  • 推荐度:★★★

 


关于作者:宋天龙,大数据技术专家,触脉咨询合伙人兼副总裁,前Webtrekk中国区技术和咨询负责人(Webtrekk,德国的在线数据分析服务提供商)。擅长数据挖掘、建模、分析与运营,精通端到端数据价值场景设计、业务需求转换、数据结构梳理、数据建模与学习以及数据工程交付。

原文地址:https://mp.weixin.qq.com/s?__biz=MjM5ODE1NDYyMA==&mid=2653393556&idx=1&sn=a68f7112d32c79a449730eb9002b00f6&chksm=bd1c2a878a6ba391b7ade98b3c1dbe56fa4e3b5a70af7f53dc146f8f3ec9f20ff03ecea5624c&mpshare=1&scene=1&srcid=#rd

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/285720.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

开源项目【zheng】搭建流程

2019独角兽企业重金招聘Python工程师标准>>> 搭建过程 项目地址 https://gitee.com/shuzheng/zheng这两篇写的比较详细的搭建过程&#xff0c;结合一下就没什么问题了。 https://my.oschina.net/yzuzhang/blog/1538555http://www.jianshu.com/p/b2fb42e17b581.JDK 1…

简述HTML DOM及其节点分类

在JavaScript中&#xff0c;document这个对象大家一定很熟悉&#xff0c;哪怕是刚刚开始学习的新人&#xff0c;也会很快接触到这个对象。而document对象不仅仅是一个普通的JavaScript内置对象&#xff0c;它还是一个巨大API的核心对象&#xff0c;这个巨大的API就是DOM&#x…

【CC精品教程】任务二:导入像控点、差分POS,空三平差权重设置,提交自由空三

《无人机航空摄影测量精品教程》合集目录(Pix4d、CC、EPS、PhotoScan、Inpho) 【CC精品教程】任务一:CC新建工程、添加照片、相机参数设置、选择坐标系统 本任务接着上一个任务,继续完成CC项目作业,主要内容有:导入像控点、选择空间参考系统,导入差分POS,空三平差权重设…

WPF 基础控件之 TabControl样式

其他基础控件1.Window2.Button3.CheckBox4.ComboBox5.DataGrid 6.DatePicker7.Expander8.GroupBox9.ListBox10.ListView11.Menu12.PasswordBox13.TextBox14.RadioButton15.ToggleButton16.Slider 17.TreeView TabControl 实现下面的效果1&#xff09;TabControl来实现动画&…

两个数值交换位置

2019独角兽企业重金招聘Python工程师标准>>> 先说非计算机专业都能理解的。 int a 10; int b 20; 方法一&#xff1a; int c a; a b; b c; System.out.println("a"a",b"b); 方法二&#xff1a; a a b; b a - b; a a - b; System.out…

教你如何在Android 6.0上创建系统悬浮窗

郭霖大神的文章:http://mp.weixin.qq.com/s?__bizMzA5MzI3NjE2MA&mid2650235949&idx1&sn0f7eded67f834d38b02f8872768cb68a&scene0#wechat_redirect今天周二&#xff0c;又该跟大家分享由我执笔的文章了。从之前我写的deep links、通知栏微技巧这两篇文章中&a…

官宣.NET 7 预览版5

点击上方蓝字关注我们&#xff08;本文阅读时间&#xff1a;12分钟)今天我们发布了 .NET 7 预览版 5。.NET 7 的这个预览版包括对通用数学的改进&#xff0c;方便了 API 作者&#xff0c;使其更轻松&#xff0c;一个新的 ML.NET 文本分类 API&#xff0c;增加了最先进的深度学习…

[转]Android产品研发(十九)

转载请标明出处&#xff1a;一片枫叶的专栏 上一篇文章中我们讲解了webview中问题集锦&#xff0c;讲解了webview的性能优化、webview种入Cookie信息、activity退出的时候清除webview信息报错、如何通过java代码和js代码相互交互、webview如何下载文件以及腾讯的X5浏览服务等知…

【CC精品教程】ContextCapture 10.17安装教程(附CC10.17安装包下载)

《无人机航空摄影测量精品教程》合集目录(Pix4d、CC、EPS、PhotoScan、Inpho) CC10.17相比之前的版本有了好的新的功能和优点,在倾斜摄影测量中有了更多的优势,精度和运行速度有了很大的提升。本文讲解CC的安装,附CC10.17安装包下载,是您航测倾斜摄影测量的入门必备。 文…

mac SecureCRT设置

参考&#xff1a; http://www.2cto.com/os/201407/320292.html SecureCRT 设置 1&#xff09;每次登陆都要输入密码&#xff1a; Global Option -> General 取消&#xff1a;Use Keychain前面的勾 2&#xff09;Logon Actions Logon Actions很强大&#xff0c;和python里…

华为云GaussDB,11.11让企业无后顾之忧

每年11.11大促对于数据库而言都是一场生死考验&#xff0c;如何保障系统的稳定可靠&#xff0c;如何平稳度过业务流量洪峰期&#xff0c;如何高效扩容&#xff0c;成为每个参与活动客户的一大痛点。本文将通过5个常见的大促问题及分析&#xff0c;看看华为云GaussDB是如何解决这…

【CC精品教程】ContextCapture(CC)集群处理环境部署图文教程

《无人机航空摄影测量精品教程》合集目录(Pix4d、CC、EPS、PhotoScan、Inpho) 鉴于CC其三维构建运算的本质,海量数据的解析运算会使用大量的计算机资源,而再好的单台计算机也无法胜过多台计算机的并行运算能力,故而借助局域网内多台计算机设备进行三维构建运算,可以节省大…

Linux-PAM PAM-MySQL的总结

1、理论知识 1.1、PAM模块 1.1.1、PAM的介绍 Pluggable Authentication Modules简称PAM&#xff0c;是一个微缩的可插入认证模块&#xff08;PAM is an acronym for Pluggable Authentication Modules&#xff09; 1.1.2、PAM的结构 1)模块层(PAM服务模块) - PAM结构最底层 作用…

ubuntu下配置jdk(离线压缩包方式)

2019独角兽企业重金招聘Python工程师标准>>> 1&#xff0c;下载jdk压缩包 2、解压后得到名字为jdk1.7.0_21的文件夹&#xff0c;将其复制到 /usr/lib/jvm下&#xff08;需要新建jvm文件夹&#xff09;。3、配置jdk环境变量&#xff1a;在启动终端并输入 gedit /e…

【PhotoScan精品教程】PhotoScan简介、安装教程(附PhotoScan1.4.5安装包下载)

《无人机航空摄影测量精品教程》合集目录(Pix4d、CC、EPS、PhotoScan、Inpho) PhotoScan在无人机航空摄影测量空三运算中,具有运行速度快、精度高等特点。PhotoScan空三运算的结果可以导入CC等进行模型构建。【PhotoScan精品教程】讲解利用PhotoScan软件进行航测内业空三运算…

利用JS脚本快速删除百度网盘同一目录下的不需要文件(可以参考这个方法删除重复文件)

比如百度网盘某目录下存有如下文件&#xff1a; 要求&#xff1a;将如上图文件目录下的文件&#xff0c;每个月只保留最后&#xff08;新&#xff09;一个&#xff08;根据文件名中包含的日期&#xff09;&#xff0c;其它删除。 比如7月份有3个文件&#xff0c;只保留2019-07-…

依赖注入之针对不同类型变量的几种注入方式

控制反转(Inversion of Control)和依赖注入(Dependency Injection)讲的都是一个概念,只不过是站在了不同的角度,所谓的依赖注入: 依赖注入&#xff08;DI&#xff09;是指在运行期&#xff0c;由外部容器动态地将依赖对象注入到组件中。当spring容器启动后&#xff0c;spring容…

【本周六活动】.NET Day in China

点击蓝字关注我们编辑&#xff1a;Alan Wang排版&#xff1a;Rani Sun活动介绍去年11月&#xff0c;.NET 6 的发布&#xff0c;为我们带来了 .NET 多平台应用 UI&#xff08;.NET MAUI&#xff09;。就在前不久&#xff0c;.NET MAUI 已正式发布。未来&#xff0c;作为 .NET 7 …

【PhotoScan精品教程】任务一:新建工程、导入照片、设置坐标系、导入控制点(POS)、自由空三

《无人机航空摄影测量精品教程》合集目录(Pix4d、CC、EPS、PhotoScan、Inpho) 【PhotoScan精品教程】任务一:新建工程、导入照片、设置坐标系、导入控制点(POS)、自由空三 【PhotoScan精品教程】任务二:刺像控点,平差,质量报告精度检查,像控点POS权重调配 【PhotoScan…

[转]Angular 单元测试讲解

Angular_单元测试 测试分类 按开发阶段划分按是否运行划分按是否查看源代码划分其他ATDD,TDD,BDD,DDD ATDDTDDBDDDDDAngular单元测试 Karma的介绍jasmine介绍单元测试的好处使用jasmine和karma创建一个Angular项目Karma配置Test.ts文件测试体验测试Form测试服务service常用断言…