数据直观分析与可视化

数据直观分析与可视化


一、数据的直观分析核心价值

数据的直观分析旨在通过视觉化的方式,帮助人们更直观、更快速地理解数据的特征和模式,从而发现趋势、异常值、分布情况以及变量之间的关系,为决策提供支持。

数据可视化与信息图形、信息可视化、科学可视化及统计图形密切相关。

可视化的终极目标是洞悉蕴含在数据中的现象和规律,这里面有多重含义:发现、决策、解释、分析、探索和学习。


二、特殊统计图绘制技巧

2.1 函数图绘制

# 椭圆图
plt.plot(x,y,c='r')
plt.axvline(x=0)
plt.axhline(y=0)
plt.text(0.2,1,r'$\frac{x^2}{a^2}+\frac{y^2}{b^2}=1$',fontsize=25)

在这里插入图片描述

2.2 气泡图与三维可视化

# 二维气泡图,s=8y
x=np.linspace(-4,4,20) 
print(x)
y=x**2                    
plt.scatter(x,y,s=100*y)  

在这里插入图片描述

# 三维散点图
# 创建数据
x = np.linspace(-5, 5, 100)
X, Y = np.meshgrid(x, x)                # 从坐标向量x,y中返回坐标矩阵
Z = np.sin(np.sqrt(X**2 + Y**2))        # Z=sin(sqrt(X^2+Y^2))# 创建图形
fig = plt.figure(figsize=(10, 8))
ax = fig.add_axes(Axes3D(fig, elev=30, azim=20))  # 使用add_axes方法创建3D坐标轴
ax.scatter(X, Y, Z, c=Z, cmap='viridis', s=30, alpha=0.6)  # 添加颜色映射和透明度# 设置标签
ax.set_xlabel('X')
ax.set_ylabel('Y')
ax.set_zlabel('Z')# 显示图形
plt.show()

在这里插入图片描述


三、Seaborn高效统计绘图

3.1 箱线图与小提琴图对比

绘图所用数据如下:

# 读取绘图用数据
import pandas as pd
BSdata=pd.read_excel('DaPy_data.xlsx','BSdata')
BSdata.head()

在这里插入图片描述

# 箱线图(boxplot)
sns.boxplot(x=BSdata['身高'])

在这里插入图片描述

# 小提琴图(violinplot)
sns.violinplot(x='开设', y='支出', hue='性别', data=BSdata)

在这里插入图片描述

3.2 分布图矩阵

# 概率分布图
BSdata['身高'].hist() 

在这里插入图片描述


四、ggplot绘图系统实践

在这里插入图片描述

4.1 基础使用

包的安装:

!pip show ggplot
!pip show plotnine

包的加载与设置:

from plotnine import *    #加载和调用ggplot所有方法
theme_set(theme_bw(base_family='SimHei')) 
#设置图形主题背景为白色bw、中文字体为黑体SimHei

4.2 ggplot中图层

GP=ggplot(BSdata,aes(x='身高',y='体重')) #绘制直角坐标系
GP 

在这里插入图片描述

GP + geom_point()  #增加点图

在这里插入图片描述

GP + geom_line()   #增加线图

在这里插入图片描述

GP + geom_point() + geom_line()  #增加点和线图

在这里插入图片描述

4.3 统计图绘制

#在plotnine中可使用facet_wrap参数可以按类型绘制分面图。
ggplot(BSdata,aes('身高','体重')) + geom_point() + facet_wrap('性别',nrow=2) 

在这里插入图片描述

# 折线图
ggplot(BSdata,aes(x='支出',y='身高',color='性别',shape='性别')) + geom_line() + geom_point()

在这里插入图片描述


五、pyecharts动态绘图精解

pyecharts是基于Echarts图表的一个类库,而Echarts是百度开源的商业级数据图表,它是一个纯JavaScript的图表库,可以为用户提供直观生动、可交互、可高度个性化定制的数据可视化图表,赋予了用户对数据进行挖掘整合的能力。

https://echarts.apache.org/zh/index.html

pyecharts主要基于web浏览器进行显示,绘制的图形比较多,包括折线图、柱状图、饼图、漏斗图、地图、极坐标图等,代码量很少,而且很灵活,绘制出来的图形很美观。

使用pyecharts时,需要安装相应的库,安装命令为:

pip install pyecharts
A Python Echarts Plotting Library——https://pyecharts.org/#/

5.1 pyecharts安装全攻略

环境准备
# 创建虚拟环境(推荐)
python -m venv vis_env
source vis_env/bin/activate  # Linux/Mac
vis_env\Scripts\activate     # Windows# 核心安装
pip install pyecharts -U# 扩展组件
pip install echarts-countries-pypkg      # 437个国家地图
pip install echarts-china-provinces-pypkg # 34个省级行政区
pip install echarts-china-cities-pypkg    # 367个市级城市
版本验证
import pyecharts
print(pyecharts.__version__)  # 输出应为1.x.x或2.x.x

5.2 基础图表快速上手

动态柱状图
from pyecharts.charts import Barbar = Bar()
bar.add_xaxis(["苹果", "华为", "小米", "OPPO"])
bar.add_yaxis("手机销量", [25, 30, 18, 22])
bar.set_global_opts(title_opts={"text": "2023 Q2手机销量统计"})
bar.render('phone_sales.html')

在这里插入图片描述

3D散点图
from pyecharts.charts import Scatter3D
import randomdata = [[random.randint(0,100) for _ in range(3)] for _ in range(100)]
scatter = Scatter3D().add("", data)
scatter.render("3d_scatter.html")

在这里插入图片描述

5.3 高级配置技巧

地图可视化
from pyecharts.charts import Mapdata = [("广东", 125), ("江苏", 98), ("山东", 87)]
map_chart = Map().add("GDP分布", data, "china")
map_chart.set_global_opts(visualmap_opts=opts.VisualMapOpts(max_=150))
map_chart.render('china_gdp.html')

在这里插入图片描述


六、常见问题解决方案

6.1 地图显示异常处理

现象:地图空白或只显示轮廓

# 正确加载省级地图
from pyecharts.datasets import register_url
register_url("https://echarts-maps.github.io/echarts-china-provinces-js/")# 强制刷新缓存
import pyecharts.globals as g
g._WarningControl.ShowWarning = False

6.2 Jupyter内联显示配置

from pyecharts.globals import CurrentConfig
CurrentConfig.NOTEBOOK_SHOW = True# 显示图表
bar.load_javascript()
bar.render_notebook()

七、可视化最佳实践建议

  1. 数据预处理:清洗缺失值,规范数据格式

  2. 颜色选择:使用ColorBrewer科学配色方案

  3. 交互设计:合理控制动画效果复杂度

  4. 移动适配:响应式布局配置

   bar.set_global_opts(datazoom_opts=[opts.DataZoomOpts(type_="inside")],toolbox_opts=opts.ToolboxOpts(is_show=True))

八、学习资源推荐

  1. ECharts官方示例库
  2. pyecharts-gallery项目
  3. 《Python数据可视化之美》专业书籍
  4. DataViz项目实战案例集

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/80779.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Neo4j数据库

Neo4j 是一款专门用来处理复杂关系的数据库。我们可以简单地将它理解为一个“用图结构来管理数据的工具”。与我们常见的,像 Excel 那样用表格(行和列)来存储数据的传统数据库不同,Neo4j 采用了一种更接近人类思维对现实世界理解的…

Java异常处理全解析:从基础到自定义

目录 🚀前言🤔异常的定义与分类💯运行时异常💯编译时异常💯异常的基本处理 🌟异常的作用🐧自定义异常💯自定义运行时异常💯自定义编译时异常 ✍️异常的处理方案&#x1…

Redisson分布式集合原理及应用

Redisson是一个用于Redis的Java客户端,它简化了复杂的数据结构和分布式服务的使用。 适用场景对比 数据结构适用场景优点RList消息队列、任务队列、历史记录分布式共享、阻塞操作、分页查询RMap缓存、配置中心、键值关联数据支持键值对、分布式事务、TTLRSet去重集…

打破次元壁,VR 气象站开启气象学习新姿势​

在教育领域,VR 气象站同样发挥着巨大的作用,为气象教学带来了全新的模式,打破了传统教学的次元壁,让学生们以全新的姿势学习气象知识。​ 在传统的气象教学中,学生们主要通过课本、图片和老师的讲解来学习气象知识。这…

k8s面试题-ingress

场景:我通过deployment更新pod,ingress是怎么把新的请求流量发送到我新的pod的?是怎么监控到我更新的pod的? 在 Kubernetes 中,Ingress 是一种 API 对象,用于管理外部访问到集群内服务的 HTTP 和 HTTPS 路…

RHCE 练习三:架设一台 NFS 服务器

一、题目要求 1、开放 /nfs/shared 目录,供所有用户查询资料 2、开放 /nfs/upload 目录,为 192.168.xxx.0/24 网段主机可以上传目录,并将所有用户及所属的组映射为 nfs-upload,其 UID 和 GID 均为 210 3.将 /home/tom 目录仅共享给 192.16…

【动态导通电阻】GaN HEMT动态导通电阻的精确测量

2023 年 7 月,瑞士洛桑联邦理工学院的 Hongkeng Zhu 和 Elison Matioli 在《IEEE Transactions on Power Electronics》期刊发表了题为《Accurate Measurement of Dynamic ON-Resistance in GaN Transistors at Steady-State》的文章,基于提出的稳态测量方法,研究了氮化镓(…

AI 制作游戏美术素材流程分享(程序员方向粗糙版)

AI 制作游戏美术素材分享(程序员方向粗糙版) 视频讲解: 抖音:https://www.douyin.com/user/self?from_tab_namemain&modal_id7505691614690561295&showTabpost Bilibili: https://www.bilibili.com/video/BV1ojJGzZEve/ 写在最前面: 本方法比较粗糙,只对对美术风…

Java求职面试:互联网大厂技术栈深度解析

文章简述 在这篇文章中,我们将通过一个模拟的面试场景,带你深入了解Java求职面试中可能会遇到的技术栈问题。通过这个故事,你可以学习到相关技术点的具体应用场景和面试技巧。 正文 场景:某互联网大厂的面试现场 面试官&#…

学习日记-day11-5.20

完成目标: comment.java package com.zcr.pojo; import org.hibernate.annotations.GenericGenerator;import javax.persistence.*; //JPA操作表中数据,可以将对应的实体类映射到一张表上Entity(name "t_comment")//表示当前的实体类与哪张表…

机器学习第十九讲:交叉验证 → 用五次模拟考试验证真实水平

机器学习第十九讲:交叉验证 → 用五次模拟考试验证真实水平 资料取自《零基础学机器学习》。 查看总目录:学习大纲 关于DeepSeek本地部署指南可以看下我之前写的文章:DeepSeek R1本地与线上满血版部署:超详细手把手指南 交叉验证…

Linux面试题集合(6)

创建多级目录或者同级目录 mkdir -p 文件名/文件名/文件名 mkdir -p 文件名 文件名 文件名 Linux创建一个文件 touch 文件名 DOS命令创建文件 echo 内容>文件名(创建一个有内容的文件) echo >文件名(创建一个没有内容的文件&#xff09…

Vue百日学习计划Day46-48天详细计划-Gemini版

Day 46: <KeepAlive> - 组件缓存与优化 (~3 小时) 本日目标: 理解 <KeepAlive> 的作用&#xff0c;学会如何使用它来缓存组件实例&#xff0c;从而优化应用性能和用户体验。所需资源: Vue 3 官方文档 (<KeepAlive>): https://cn.vuejs.org/guide/built-ins/…

SpringBean模块(三)具有生命周期管理能力的类(1)AutowireCapableBeanFactory

一、介绍 1、简介 AutowireCapableBeanFactory 是 Spring 框架中的一个接口&#xff0c;位于 org.springframework.beans.factory 包下&#xff0c;它提供了更底层的 Bean 实例化、依赖注入和生命周期管理能力&#xff0c;即使这些 Bean 没有通过常规的 Component 或 XML 注册…

Service Mesh

目录 一、Service Mesh 的核心特点 二、Service Mesh 的典型架构 1. Sidecar 模式 2. 控制平面与数据平面分离 三、Service Mesh 解决的核心问题 四、典型应用场景 五、主流 Service Mesh 框架对比 六、挑战与局限性 七、未来趋势 总结 Istio 一、Istio 核心组件与…

黑马Java基础笔记-13常用查找算法

查找算法 基本查找(也叫顺序查找&#xff0c;线性查找) 二分查找&#xff08;需要有序数据&#xff09; public static int binarySearch(int[] arr, int number){//1.定义两个变量记录要查找的范围int min 0;int max arr.length - 1;//2.利用循环不断的去找要查找的数据wh…

Go 语言 vs C+Lua(Skynet)游戏服务器方案对比分析

为啥挑这两个呢&#xff1f;因为两种技术分别对应CSP模型和Actor模型&#xff0c;都是经过时间检验的成熟且可靠的并发模型&#xff0c;问了很多地方&#xff0c;经过gpt整理得出如下报告。 从开发效率、运行性能、热更新扩展、云部署与水平扩展能力、多类型游戏支持等五个维度…

LeetCode 925. 长按键入 java题解

双指针。不会写。 https://leetcode.cn/problems/long-pressed-name/description/ class Solution {public boolean isLongPressedName(String name, String typed) {int len1name.length();int len2typed.length();int i0,j0;while(i<len1&&j<len2){if(name.ch…

如何使用通义灵码提高前端开发效率

工欲善其事&#xff0c;必先利其器。对于前端开发而言&#xff0c;使用VSCode已经能够极大地提高前端的开发效率了。但有了AI加持后&#xff0c;前端开发的效率又更上一层楼了&#xff01; 本文采用的AI是通义灵码插件提供的通义千问大模型&#xff0c;是目前AI性能榜第一梯队…

【小明剑魔视频Viggle AI模仿的核心算法组成】

Viggle AI 作为一款先进的生成式视频AI工具&#xff0c;其核心技术栈融合了多项前沿算法。以下是深度解析其核心算法架构及实现原理&#xff1a; 一、核心算法组成 1. 运动控制生成&#xff08;Motion Control Generation&#xff09; 算法框架&#xff1a;基于扩散模型&…