多元数据直观表示(R语言)

一、实验目的:

       通过上机试验,掌握R语言实施数据预处理及简单统计分析中的一些基本运算技巧与分析方法,进一步加深对R语言简单统计分析与图形展示的理解。

数据:
链接: https://pan.baidu.com/s/1kMdUWXuGCfZC06lklO5iXA 提取码: g55h

二、实验内容:

bank.csv文件中数据来自1969-1971年美国一家银行的474名职员情况调查。该数据共8个变量,包括:

gender:性别,1代表男性,2代表女性;

educ:受教育年限(单位:年);

jobcat:职位等级,分1,2,3级,1级工作地位最低,3级最高;

salary:当前工资(单位:美元/年);

salbegin:初始工资,指进入银行初始薪酬(单位:美元/年);

jobtime:工作月份,指在银行累计工作时间(单位:月);  

prevexp:以前工作经历,指在其他单位累计工作时间(单位:月);

minority: 是否少数民族,0代表不是,1代表是。

(1)请绘制折线图,展示工资如何随工作时间变化,并对图形进行解读。

(2)请绘制气泡图,展示性别、职位等级与当前工资的关系,并对图形进行解读。

3)(至少有两个分析)自行选择感兴趣的变量与分析目的,利用基本统计分析图形进行直观表示并加以解读。此小题对使用何种图形展示不做严格要求,只需不是折线图及气泡图即可。

三、实验过程与结果:

1)绘制折线图,展示工资如何随工作时间变化,并对图形进行解读:

data<-read.csv("E:/学习资料及作业/2.2多元统计分析R/实验1/bank.csv")datad1<-aggregate(salary~jobtime,data,mean)  #求salary的均值library(ggplot2)ggplot(data=d1,aes(x=jobtime,y=salary))+ # 折线图geom_line(color="green",size=1) #线的颜色、粗细

运行结果:

解读分析:

       从总体上看,工作时间jobtime与工资salary之间不存在线性关系,即使工作时间在小范围内变化,薪资可能波动较大。当工作时间超过90时,总体的薪资会比工作时间小于90的多一点儿,表明工作时间会对薪资有一定的影响,但薪资并不是只由工作时间直接决定的,还存在其他因素对其有影响。

2)绘制气泡图,展示性别、职位等级与当前工资的关系,并对图形进行解读。

d2<-aggregate(x=data$salary,by=list(data$jobcat,data$gender),FUN=mean)d2ggplot(data=d2,aes(x=Group.1, y=Group.2, size=x,col=1)) +geom_point(alpha=0.5) + #调整圆圈透明度scale_size(range = c(1, 10), name="性别、职位等级与当前工资的关系图")+ #图例名称xlab('jobcat') +  # 更改x、y轴名称ylab('gender')

运行结果:

解读分析:

       男性13等级都有分布,女性只有13等级,从男性角度来看,12等级的薪资差别不大,但123等级薪资相差较大,都快相差两倍了;从女性角度来看,等级1与等级3相差巨大。并且男性和女性都为等级1时,男性的薪资与女性的相差较大。

3)自行选择感兴趣的变量与分析目的,利用基本统计分析图形进行直观表示并加以解读。此小题对使用何种图形展示不做严格要求,只需不是折线图及气泡图即可。

分别用箱型图绘制职位等级与受教育年限、职位等级与薪资的关系:

代码:

data$jobcat<-factor(data$jobcat)ggplot(data,aes(x=jobcat,y=educ))+geom_boxplot()+labs(title="职位等级与受教育年限的关系",x="职位等级",y="受教育年限")+theme(plot.title = element_text(hjust=0.5))data$jobcat<-factor(data$jobcat)ggplot(data,aes(x=jobcat,y=salary))+geom_boxplot()+labs(title="职位等级与薪资的关系",x="职位等级",y="薪资")+theme(plot.title = element_text(hjust=0.5))

运行结果:

 

解读分析:

       从均值来看,等级1、2的受教育的年限均值相同,等级3最高,但等级1、2的薪资均值相差不大,等级3的薪资却比等级1、2高得多,从某种程度上可以表明受教育年限越高,其薪资也越高。等级2的薪资较为集中,几乎没什么波动。

受教育年限、以前工作经历与初始工资的关系:

代码:

d3<-aggregate(x=data$salbegin,by=list(data$prevexp,data$educ),FUN=mean)ggplot(data=d3,aes(x=Group.1, y=Group.2, size=x,col=1)) +geom_point(alpha=0.5) + #调整圆圈透明度scale_size(range = c(1, 10), name="受教育年限、以前工作经历与初始工资的关系图")+ #图例名称xlab('prevexp') +  # 更改x、y轴名称ylab('educ')

解读分析:

受教育越高的平均工作时间要比受教育低的少,并且获得的薪酬也相对多一些。

以前的工作经历对初始薪资的影响:

代码:

d4<-aggregate(salbegin~prevexp,data,mean)order<-sort(d4$prevexp,decreasing=T)ggplot(data=d4,aes(prevexp,salbegin))+geom_bar(stat="identity",width=0.8,colour="black",linewidth=0.25,fill="#FC4E07",alpha=1)

运行结果:

解读分析:

        以前的工作经历大多集中在0-120个月,即1-10年,随着工作经历的增加,会出现少数再找工作时,其初始工资很高,但是总体工作经历对其再工作时的初始工资没有什么影响。并且当工作经历达到200个月以上时,再次换工作的人也偏少了,这可能与他们进入中年,追求平稳的生活可能有关。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/72289.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

第8天:面向对象编程入门 - 类与对象

第8天&#xff1a;面向对象编程入门 - 类与对象 一、&#x1f4da; 今日学习目标 &#x1f3af; 掌握类与对象的定义与使用&#x1f527; 理解封装、继承、多态三大特性&#x1f4a1; 完成银行账户管理系统实战&#x1f6e0;️ 学会构造函数与析构函数的编写 二、⚙️ 核心知…

Hadoop之02:MapReduce编程模型

MapReduce编程模型 理解MapReduce编程模型独立完成一个MapReduce程序并运行成功了解MapReduce工程流程掌握并描述出shuffle全过程&#xff08;面试&#xff09;独立编写课堂及作业中的MR程序理解并解决数据倾斜 1. MapReduce编程模型 Hadoop架构图 Hadoop由HDFS分布式存储、M…

2.7 大模型RAG内容安全合规检查-大模型ACP模拟题-真题

单选题 在RAG应用中&#xff0c;输入内容合规检查的正确顺序是&#xff1f; A. 先处理模型生成&#xff0c;后检查用户输入 B. 先检查用户输入&#xff0c;后处理模型生成 ✅ C. 仅检查用户输入 D. 仅检查模型输出 解析&#xff1a;合规流程应优先过滤用户输入风险&#xff0…

mapbox基础,使用geojson加载heatmap热力图层

👨‍⚕️ 主页: gis分享者 👨‍⚕️ 感谢各位大佬 点赞👍 收藏⭐ 留言📝 加关注✅! 👨‍⚕️ 收录于专栏:mapbox 从入门到精通 文章目录 一、🍀前言1.1 ☘️mapboxgl.Map 地图对象1.2 ☘️mapboxgl.Map style属性1.3 ☘️heatmap热力图层样式二、🍀使用geojs…

Deepseek Api Function Calling解析(tools、tool_calls)Deepseek函数调用流程图、Python代码示例

文章目录 Function Calling介绍**核心原理**1. **动态扩展模型能力**2. **JSON结构化交互** **实现步骤**&#xff08;以支持Function Calling的模型为例&#xff09;1. **定义可用函数**2. **模型匹配与生成**3. **开发者执行函数**4. **结果反馈给模型** **DeepSeek R1的当前…

在2023idea中如何创建SpringBoot

目录 一.下载和安装 Maven 1.前往 https://maven.apache.org/download.cgi 下载最新版的 Maven 程序 2.将文件解压到D:Program FilesApachemaven目录 3.新建环境变量MAVEN_HOME&#xff0c;赋值D:Program FilesApachemaven 4.编辑环境变量Path&#xff0c;追加%MAVEN_HOME…

基于YOLO11深度学习的遥感视角农田检测与分割系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战、目标分割、人工智能

《------往期经典推荐------》 一、AI应用软件开发实战专栏【链接】 项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体检测系统开发】5.【图片风格快速迁移软件开发】6.【人脸表表情识别系统】7.【…

用冒泡排序法模拟qsort函数

目录 1.前言 2.qsort函数的介绍 ​3.冒泡法回顾 4.模拟qsort---buble_sort 4.1 buble_sort格式 4.2 主函数&#xff0c;以int类型为例 4.3comp_int函数的功能设计 4.4 swap函数的功能设计 5. 总代码概览 1.前言 今天&#xff0c;小邓儿带大家用冒泡排序法来模拟一下qs…

全星研发项目管理APQP软件系统:铸造芯片集成电路产业研发体系化建设平台

全星研发项目管理APQP软件系统&#xff1a;铸造芯片集成电路产业研发体系化建设平台 在芯片集成电路行业&#xff0c;研发效率和质量直接决定了企业的核心竞争力。面对日益复杂的芯片设计、日益缩短的产品生命周期以及日益严格的质量要求&#xff0c;传统的研发管理模式已难以满…

《Python实战进阶》No 11:微服务架构设计与 Python 实现

第11集&#xff1a;微服务架构设计与 Python 实现 2025年3月3日更新了代码和微服务运行后的系统返回信息截图&#xff0c;所有代码在 python3.11.5虚拟环境下运行通过。 微服务架构通过将复杂应用拆分为独立部署的小型服务&#xff0c;显著提升了系统的可扩展性和维护性。本集…

USRP7440-通用软件无线电平台

1、产品描述 USRP7440基于第三代XILINX Zynq UltraScale RFSoC架构&#xff0c;它将射频ADC、DAC、ARM、FPGA等集成一体&#xff0c;瞬时带宽可以达到2.5GHz&#xff0c;尤其适合于射频直采应用&#xff0c;比如通信与雷达。 第一代RFSOC高达4GHz • 8x 或 16x 6.554GSPS DAC…

1.2.3 使用Spring Initializr方式构建Spring Boot项目

本实战概述介绍了如何使用Spring Initializr创建Spring Boot项目&#xff0c;并进行基本配置。首先&#xff0c;通过Spring Initializr生成项目骨架&#xff0c;然后创建控制器HelloController&#xff0c;定义处理GET请求的方法hello&#xff0c;返回HTML字符串。接着&#xf…

【小羊肖恩】小羊杯 Round 2 C+K

题目链接&#xff1a;https://ac.nowcoder.com/acm/contest/100672#question C.是毛毛虫吗&#xff1f; 思路&#xff1a; 其实很简单&#xff0c;假设我们要满足题目所给条件&#xff0c;那么这个毛毛虫最坏情况下肯定是一条如下图所示的无向图 右端省略号为对称图形 &…

不谓侠--记录

音乐《不谓侠》 衣襟上 别好了晚霞 余晖送我牵匹老马 正路过 烟村里人家 恰似当年故里正飞花 醉过风 喝过茶 寻常巷口寻个酒家 在座皆算老友 碗底便是天涯 天涯远 无处不为家 蓬门自我也像广厦 论意气 不计多或寡 占三分便敢自称为侠 刀可捉 拳也耍 偶尔闲来…

不同规模企业如何精准选择AI工具: DeepSeek、Grok 和 ChatGPT 三款主流 AI 工具深度剖析与对比

本文深入探讨了最近国内外主流的 DeepSeek、Grok 和 ChatGPT 三款主流 AI 工具的技术细节、性能表现、应用场景及局限性&#xff0c;并从技术能力、功能需求、成本预算、数据安全和合规以及服务与支持五个关键维度&#xff0c;详细分析了不同规模企业在选择 AI 工具时的考量因素…

Vue核心知识:KeepLive全方位分析

KeepAlive 是 Vue 组件中的一个重要功能&#xff0c;主要用于缓存组件&#xff0c;以提升性能和用户体验。 目录 一、KeepAlive 基本概念二、KeepAlive 的核心原理三、KeepAlive 关键属性解析1. include&#xff1a;指定需要缓存的组件2. exclude&#xff1a;指定不需要缓存的组…

【电力——tarjan割点,求连通块】

题目 分析 这是割点的板子 代码 #include <bits/stdc.h> using namespace std;const int N 1e410; const int M 3e410;int h[N], e[M], ne[M], idx; int dfn[N], low[N], tot; int root, ans;void add(int a, int b) // 添加一条边a->b {e[idx] b, ne[idx] h…

【HTTP】解码网络通信的奥秘:HTTP,IP 地址,端口,DNS及NAT地址转换的协同之舞

引言 每文学习一句诗&#xff1a;行一棋不足以见智&#xff0c;弹一弦不足以见悲 ——《淮南子说林训》 译文&#xff1a;走一个棋子&#xff0c;不足以现出智慧&#xff1b;弹一根琴弦&#xff0c;不能够使人产生悲哀之情。 自述&#xff1a;互联网现如今已经成为每个人都离不…

18、深拷贝与浅拷贝的区别【中高频】

浅拷贝 浅拷贝只是拷贝了一个指针&#xff0c;并没有开辟一块新的内存。拷贝的指针和原来的指针 指向同一块地址。当一个对象修改了资源&#xff0c;另一个对象也会受到影响&#xff0c;因此浅拷贝是有风险的&#xff1a;当两个对象都销毁 并调用析构函数时&#xff0c;会造成…

【Linux】从入门到精通:Make与Makefile完全指南

欢迎来到 CILMY23 的博客 &#x1f3c6;本篇主题为&#xff1a;从入门到精通&#xff1a;Make与Makefile完全指南 &#x1f3c6;个人主页&#xff1a;CILMY23-CSDN博客 &#x1f3c6;系列专栏&#xff1a;C | C语言 | Linux | Python | 数据结构和算法 | 算法专题 &#x1…