Seaborn:推荐一个好用的Python可视化工具

1. 引言

Seaborn 是建立在 matplotlib 基础上的数据可视化库,并与 Python 中的 pandas 数据结构紧密结合。可视化是 Seaborn 的核心部分,有助于直观的理解数据。

闲话少说,我们直接开始吧!

2. 安装

Seaborn库主要提供以下功能:

面向数据集的应用程序接口,用于确定变量之间的关系。
自动估计和绘制线性回归图。
它支持多网格图的高级抽象。

使用Seaborn库,我们可以方便地绘制各种图形。我们可以使用的以下命令进行安装:

pip install seaborn

要初始化 Seaborn 库,一般使用以下命令:

import seaborn as sns

3. 引入数据集

为了展示使用 Seaborn 库进行各种图形的绘制,我们这里使用googleplaystore.csv数据集,大家可以在kaggle网站进行下载。

在继续之前,首先让我们访问一下数据集:

import pandas as pd
import numpy as np
pstore = pd.read_csv("googleplaystore.csv")
pstore.head(10)

数据集的示例如下:

在这里插入图片描述

4. 数据直方分布图

首先,让我们看看上述数据集中第三列 Rating 列即APP评分列的数据直方分布图,代码如下:

#importing all the libraries
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
pstore = pd.read_csv("googleplaystore.csv")
#Create a distribution plot for rating
sns.distplot(pstore.Rating)
plt.show()

运行后得到结果如下:
在这里插入图片描述
观察上图,在直方分布图上绘制的曲线KDE就是近似的概率密度曲线。

5. 参数设置

matplotlib 中的直方图类似,在直方分布图中,我们也可以改变bins 数目,使图形更易于理解。

#Change the number of bins
sns.distplot(inp1.Rating, bins=20, kde=False)
plt.show()

现在,图表看起来是这样的,如下:
在这里插入图片描述
在上图中,我们在代码中设置kde = False 后,运行后没有概率密度曲线。要删除该曲线,只需对变量kde 进行相应设置即可。

6. 控制颜色

我们还可以像matplotlib 一样为直方分布图提供标题和颜色。相关代码如下:

#importing all the libraries
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns#Create a distribution plot for rating
sns.distplot(pstore.Rating, bins=20, color="g")
plt.title("Distribution of app ratings", fontsize=20, color = 'red')
plt.show()

运行后结果如下:
在这里插入图片描述

7. 默认样式

使用 Seaborn 的最大优势之一是,它为我们的图表提供了多种默认样式选项。以下都是 Seaborn 提供的默认样式:

'Solarize_Light2','_classic_test_patch','bmh','classic','dark_background','fast','fivethirtyeight','ggplot','grayscale','seaborn','seaborn-bright','seaborn-colorblind','seaborn-dark','seaborn-dark-palette','seaborn-darkgrid','seaborn-deep','seaborn-muted','seaborn-notebook','seaborn-paper','seaborn-pastel','seaborn-poster','seaborn-talk','seaborn-ticks','seaborn-white','seaborn-whitegrid','tableau-colorblind10'

我们只需编写一行代码,就能将这些样式整合到我们的图表中。

#importing all the libraries
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns#Adding dark background to the graph
plt.style.use("dark_background")#Create a distribution plot for rating
sns.distplot(pstore.Rating, bins=20, color="g")
plt.title("Distribution of app ratings", fontsize=20, color = 'red')
plt.show()

为图表添加深色背景后,分布图看起来就像这样了,如下所示:
在这里插入图片描述

8. 饼图

饼图一般用于分析不同类别中的数据分布。在我们使用的数据集中,我们将分析内容评级列Content Rating 中排名前 4 位的类别的数量。首先,我们将对 "内容评级 "列Content Rating 进行数据清理和挖掘,并统计相应类别的数量。

#importing all the libraries
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns#Analyzing the Content Rating column
count = pstore['Content Rating'].value_counts()
print(count)

得到结果如下:
在这里插入图片描述
根据上述输出结果,由于 Adults only 18+ Unrated 的这两个类别的计数明显少于其他类别,我们将从内容分级中删除这些类别并更新数据集。

#Remove the rows with values which are less represented 
pstore = pstore[~pstore['Content Rating'].isin(["Adults only 18+","Unrated"])]
#Resetting the index
pstore.reset_index(inplace=True, drop=True)
#Analyzing the Content Rating column again
count = pstore['Content Rating'].value_counts()
print(count)

得到结果如下:
在这里插入图片描述
现在,让我们为 上述统计结果绘制相应的饼图,代码如下:

#Plotting a pie chart
plt.figure(figsize=[9,7])
pstore['Content Rating'].value_counts().plot.pie()
plt.show()

运行后得到结果如下:
在这里插入图片描述

9. 柱状图

观察上述代码输出的饼图中,我们无法正确推断类别 Everyone 10+和类别 Mature 17+这两个类别的比例谁大。当这两个类别的数值有些相似时,直接观察饼图很难评估它们之间的差异。

此时,我们可以将上述数据绘制成柱状图来克服这种情况。绘制柱状图的代码如下:

#Plotting a bar chart
plt.figure(figsize=[9,7])
pstore['Content Rating'].value_counts().plot.barh()
plt.show()

运行后如下:
在这里插入图片描述
当然,我们可以给不同类别设置不同颜色,如下:

plt.figure(figsize=[9,7])
pstore['Content Rating'].value_counts().plot.barh(color=["purple","orange","green","pink"])
plt.show()

结果如下:
在这里插入图片描述

10. 总结

本文重点介绍了如何利用Seaborn库绘制数据直方分布图以及饼图和柱状图,并给出了相应的代码示例!

您学废了嘛!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/825308.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

羊大师解析,夏天羊奶有什么搭配,可以解暑吗?

羊大师解析,夏天羊奶有什么搭配,可以解暑吗? 羊大师发现夏天羊奶的搭配方式多样,不仅可以提供丰富的营养,还有助于解暑。以下是一些推荐的搭配方式: 羊奶蜂蜜:蜂蜜的清甜口感可以改善羊奶的膻味&#xff…

学习笔记<2024.4.15-2024.4.21>:Attention Is All You Need

Transformer中Self-Attention以及Multi-Head Attention详解 (https://www.bilibili.com/video/BV15v411W78M/?spm_id_from333.337.search-card.all.click&vd_sourcef32decb03075b4a1833fe5c47c11ba94)

java篇-SpringBoot controller获取Post请求的各种方式

参考 SpringBoot controller获取Post请求的各种方式_controller post-CSDN博客

网络变压器(网络隔离变压器)是如何影响网通设备的传输速率的呢?

Hqst华轩盛(石门盈盛)电子导读:今天介绍网络变压器(网络隔离变压器/网络滤波器)是如何影响网通设备的传输速率的 一、网络变压器(网络隔离变压器/网络滤波器)的工作原理 网络变压器(网络隔离变压器/网络滤…

【网络运维知识】—路由器与交换机区别

【网络运维知识】—路由器与交换机区别 一、路由器(Router)和交换机(Switch)对比1.1 功能1.2 转发方式1.3 范围1.4 处理方式 💖The Begin💖点点关注,收藏不迷路💖 路由器&#xff08…

1、MATLAB介绍

文章目录 一、MATLAB能做什么? 一、MATLAB能做什么? MATLAB是一个可视化的计算程序,被广泛地使用与从个人计算机到超级计算机范围内的各种计算机上;MATLAB包括命令控制、可编程,有上百个预先定义好的命令和函数&#…

Spring Boot中@KafkaListener使用${}动态指定topic

项目场景: 在Spring Kafka中,我们可以使用${}来引用Spring的属性配置。这样我们就可以在不同的环境中重新配置topic名称,而不需要修改代码。 解决方案: 在application.properties或application.yml中定义topic名称: …

Xftp下载,安装与使用

1.下载网址 家庭/学校免费 - NetSarang Website (xshell.com) 链接:百度网盘 请输入提取码 提取码:jbgy 2.安装 3.使用 Linux终端ifconfig 4.问题 4.1 中文乱码

WebRTC初识

1. 概念 WebRTC (Web-Real-Time Communications) 是一项实时的通讯及技术,它允许网络应用或站点在不借助中间媒介的情况下,建立浏览器之间点对点(Peer-to-Peer)的连接,实现视频流、音频流或其他任意数据的传输。这种技…

UBUNTU新版本,一键安装NETCDF,安装netcdf-c netcdf-v

UBUNTU新版本,一键安装NETCDF,安装netcdf-c netcdf-v_ubuntu安装netcdf-CSDN博客 UBUNTU新版本,一键安装NETCDF,安装netcdf-c netcdf-v 参考连接傻瓜式安装netcdf-fortran库 1)保存bash代码,文件名为netc…

c语言之结构体与函数传递

在c语言中,结构体与函数传递 如果是结构体成员传递到函数实参,则和变量传递相同 如果是结构体变量传递给函数实参,会在内存中开辟同样大小的内存空间,并且实参内容改变时,对应实参内容不会改变。 当结构体指针变量作…

MyBatis操作数据库(4)

动态sql 动态sql是MyBatis的强大特性之一, 能够完成不同条件下的sql拼接. <if>标签 在注册用户的问题时, 可能会有这样的一个问题:就是说注册时有一些信息是必填的, 而有一些信息是选填的. 那么如果在添加用户的时候有不确定字段的传入, 程序应该如何实现呢? 这时就…

算法与数学

学过数据结构的对这个应该都不会感到陌生&#xff0c;但是乍一看原来是数学&#xff0c;然而事实就是如此。二分法的数学源头就是这个。 还有前缀和的 我们这里所说的前缀和其实就是我们在高中学的数列中的Sn(前n项和)&#xff0c;只是我们这里需要将S1 , S2 , S3 , S4 …… S…

Android apk包使用360加固工具的加固步骤

1&#xff0c;准备好已经签名打包的apk包。 2&#xff0c;在360加固官方网站下载加固exe软件。三六零天御-企业移动应用安全一站式服务平台 3&#xff0c;步骤一&#xff0c;添加加固包&#xff0c;进行加固&#xff0c;并输出加固包&#xff1a; 4&#xff0c;步骤二&#…

idea项目启动异常:Command line is too long.

项目场景&#xff1a; 提示&#xff1a;这里简述项目相关背景&#xff1a; idea中启动项目报错&#xff1a; 解决方案 在idea 的运行配置中&#xff0c;修改enviroment下的shorten command line 为jar manifest 注&#xff1a; 有时shorten command line 可能不是默认存在的…

Ubuntu20.04搭建gem5并运行helloworld

文章目录 相关资料一、安装gem5二、运行helloworld 相关资料 gem5官网知乎-计算机体系结构-gem5模拟器入门gem5:Hello World Tutorial 一、安装gem5 1.下载依赖 sudo apt install build-essential git m4 scons zlib1g zlib1g-dev \libprotobuf-dev protobuf-compiler libp…

[2021最新]Java时间戳和日期时间互转换

代码&#xff1a; import java.text.ParseException; import java.text.SimpleDateFormat;public class MainProcess {public static void main(String[] args) throws ParseException {// 1.set formatSimpleDateFormat timeSmat new SimpleDateFormat("yyyy-MM-dd HH:…

「sentinel」流量控制组件的应用

「sentinel」流量控制组件的应用 Sentinel版本QPS 一、初识Sentinel1、Sentinel2、Sentinel 和 Hystrix对比3、雪崩问题 二、环境搭建1、下载安装Sentinel2、微服务整合Sentinel 三、流量控制1、簇点链路2、流控设置3、流控模式直接关联链路 4、流控效果流控效果解释 四、热点限…

今天来解释一下HashMap`和`Hashtable`

HashMap和Hashtable是Java集合框架中两个非常重要的类&#xff0c;它们都实现了Map接口&#xff0c;用于存储键值对映射的数据结构。尽管它们在功能上有许多相似之处&#xff0c;但在实现细节、性能和用法上存在一些关键的区别。以下是HashMap和Hashtable之间的一些主要区别&am…

css div添加滚动条(附加源码)

问题描述 先看效果图。 每个商品通过后台接口查询出来&#xff0c;前端v-for进行显示&#xff0c;所以这块我要添加一个滚动条&#xff0c;我不确定有多少个商品。 解决方案 实现思路&#xff1a;div设置高度为1000rpx&#xff08;我这边是举例&#xff0c;根据实际场景去设…