毕设项目 基于大数据的K-means广告效果分析

基于大数据的K-means广告效果分析

项目运行效果:

毕业设计 基于大数据的K-means广告效果分析

🧿 项目分享:见文末!

一、分析背景和目的

在大数据时代的背景下,广告主可以购买媒介变成直接购买用户,广告的精准投放对广告主、服务平台与潜在用户而言,在提升效率与商业效益方面,有了更迫切的需求,然而网络广告形式多样,很多广告投放系统相对缺乏针对性,使得网络广告精准度不够高,因此,对推广数据的研究是十分必要的。所有本次项目将从用户特征,投放时间,投放位置以及高点击率广告的特征等方面多维度进行数据分析,以提高用户点击率,实现淘宝展示广告精准投放,实现广告投放效果最大。

注意:本文是博主自主探索数据分析的记录和总结,有些方法和结论会存在错误,希望对你学习有帮助的话我很高兴,但是有问题的话希望给小弟批评和指正。

本文使用的数据工具为mysql 和 tableau

二、数据集

数据来源阿里天池,数据集

数据名称说明属性
raw_sample原始样本骨架用户id,广告id,时间,资源位,是否点击
ad_feature广告的基本信息广告id,广告计划id,类目id,品牌id
user_profile用户的基本信息用户id,年龄层,性别等
raw_behavior用户的行为日志用户id,行为类型,时间,商品类目id,品牌id

具体字段如图:

三、分析框架和思路

对于衡量广告投放效果有三种模式:

对于cpc模式,点击率 = 点击量 / 展示量,可以使用点击量衡量投放效果,对于品牌来说,是根据点击量来进行付费的,点击率则可以体现广告的吸引力。

对于cpa模式,可以构建两个漏斗,即浏览—收藏—购买,浏览—加入购物车—购买,观察转换率可以衡量投放效果。

四、数据预处理

  1. 原数据集太大,为了方便分析,在raw_sample数据集中截取300w条数据
  2. 数据缺失值处理,如果出现缺失,将缺失的行删除即可(简单方法)


select count(user_id),count(adgroup_id),count(time_stamp),count(pid),count(noclk),count(clk)
from raw_sample;

在 user_profile 数据中 pvalue_level 字段缺失率高达53.1%,这里可以使用knn算法进行预测填充
(我比较菜,先直接忽略,后续学习python之后进行补充),而 new_user_class_level 字段的缺失率也有27.4%,可以使用众数进行补充。

  1. 数据重复值处理


select user_id, adgroup_id, time_stamp, pid, noclk, clk
from raw_sample
group by user_id, adgroup_id, time_stamp, pid, nonclk, clk
having count(user_id) >1;

  1. 数据异常值,比如有无超出时间范围
  2. 时间处理,将时间戳分解为日期和时间


alter table raw_sample add time_date varchar(20);
alter table raw_sample add time_hour varchar(20);
update raw_sample set time_date = left(from_unixtime(time_stamp),10);
update raw_sample set time_hour = right(from_unixtime(time_stamp),8);

五、数据分析

1. 广告投放渠道分析


select pid ‘资源位’,
(select COUNT() from raw_sample) ‘展示量’,
sum(clk) ‘点击量’,
sum(clk) / (select COUNT(
) from raw_sample) ‘点击率’
from raw_sample
group by pid;


结论:4300548_1007的广告投放效果会更好,而且广告吸引力也更大。

2. 广告投放时间分析

2.1 24h的投放效果


select left(time_hour,2) ‘小时’,
COUNT() ‘展示量’,
sum(clk) ‘点击量’,
sum(clk) / COUNT(
) ‘点击率’
from raw_sample
group by left(time_hour,2)
order by left(time_hour,2) ;


结论:

  1. 点击量基本符合人们的作息规律,而点击率在9-10点、13-14点和20-21点都比较高,这些时间基本就是人们工作前、中
  2. 奇怪的是在半夜1点和3点的时候点击率居然比较高,问题可能是展现量较低但点击量高,夜猫子刷淘宝的时候不容易被其他事情分散注意力,我觉得可以探索一下哪个品类的东西深得夜猫子浏览和点击,适当的进行实验性营销。

说干就干,首先查看整体展现量分布,发现将近90%的展现量在1000以内,所以我截取了时间在0-4点并且展现量大于500的商品类目,如下图确实有几个点击率很高的类目,不过他们的投入产出是否合理,这个还是看具体情况吧。

2.2 一周(8天)的投放效果


select right(time_date,2) ‘日期’,
COUNT() ‘展示量’,
sum(clk) ‘点击量’,
sum(clk) / COUNT(
) ‘点击率’
from raw_sample
group by right(time_date,2)
order by right(time_date,2) ;

结论:2017年5月6号是星期六,周末的展现量较高比较符合作息规律,周二的点击率比较高,但是周末点击率为什么比较低?因为展现量高?周五的点击率最低,是什么原因造成,这些可能需要具体分析,可以进行与其他日期进行对比分析,对比不同日期24小时效果分析。

3、广告投放人群分析

3.1 用户性别分析


select if(final_gender_code = 1, ‘男’,‘女’) ‘性别’,
sum(clk) ‘点击量’,
sum(clk) / (select COUNT(*) from raw_sample) ‘点击率’
from raw_sample,user_profile
where raw_sample.user_id = user_profile.userid
group by final_gender_code


结论:相比于男性,女性更容易被广告吸引,点击量更高。

3.2 用户消费档次分析


select case when pvalue_level =1 then ‘1’
when pvalue_level =2 then ‘2’
when pvalue_level =3 then ‘3’
end ‘消费档次’,
sum(clk) ‘点击量’,
sum(clk) / (select COUNT(*) from raw_sample) ‘点击率’
from raw_sample,user_profile
where raw_sample.user_id = user_profile.userid and
pvalue_level is not null – 缺失值未处理,直接排除
group by pvalue_level
order by pvalue_level;


结论:由于缺失值未处理,所以结论有问题,但不影响本文分析,消费档次为2的用户更容易被吸引。

3.3 用户购物深度分析


select case when shopping_level =1 then ‘浅层’
when shopping_level =2 then ‘中层’
when shopping_level =3 then ‘深层’
end ‘购物深度’,
sum(clk) ‘点击量’,
sum(clk) / (select COUNT(*) from raw_sample) ‘点击率’
from raw_sample,user_profile
where raw_sample.user_id = user_profile.userid
group by shopping_level
order by shopping_level;


结论:深度使用的用户更容易被广告吸引。

3.4 用户人群分析


select case when occupation =1 then ‘大学生’
when occupation =0 then ‘非大学生’
end ‘用户人群’,
sum(clk) ‘点击量’,
sum(clk) / (select COUNT(*) from raw_sample) ‘点击率’
from raw_sample,user_profile
where raw_sample.user_id = user_profile.userid
group by occupation;


结论:非大学生群体更容易被广告吸引。

3.5 用户年龄分析


select age_level ‘年龄层次’,
sum(clk) ‘点击量’,
sum(clk) / (select COUNT(*) from raw_sample) ‘点击率’
from raw_sample,user_profile
where raw_sample.user_id = user_profile.userid
group by age_level;


结论:年龄在3层的用户更容易被吸引

3.6 用户城市层次分析


select new_class_level ‘城市层次’,
sum(clk) ‘点击量’,
sum(clk) / (select COUNT(*) from raw_sample) ‘点击率’
from raw_sample,user_profile
where raw_sample.user_id = user_profile.userid
group by new_class_level;


结论:在城市层次2的用户更容易被广告吸引。

4、用户行为指标衡量广告投放效果(CPA)


select btag,count(btag)
from behavior_log
group by btag
order by count(btag);

浏览—加入购物车—购买的漏斗模型:
用户在点击广告浏览后,加入购物车的转化率为2.31%,购买的转化率为1.24%,选择CPA模式衡量投放效果的话,必须提高用户的加入购物车、收藏和购买的转化率,如果转化率低的话,可能是因为用户进入商品详情界面时较难激发购物欲望,需要对落地页进行优化,才能提高转化率。

六、结论和建议

  1. 渠道:4300548_1007资源位的广告投放效果会更好;
  2. 时间:在9-10点、13-14点和20-21点的时候点击率会更高,周二的点击率更高;
  3. 用户:女性、中档消费、深度购物、非大学生、年龄3档、城市层级2层的用户投放效果会更好。

本文只分析了全体的投放效果,正常需要结合品牌、商品类目和价格等进行分析,也可以结合转化率一起分析。

项目运行效果:

毕业设计 基于大数据的K-means广告效果分析

🧿 项目分享:见文末!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1013862.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VGGT如何重塑三维视觉:从单图理解到多视角重建的技术演进

VGGT如何重塑三维视觉:从单图理解到多视角重建的技术演进 【免费下载链接】vggt VGGT Visual Geometry Grounded Transformer 项目地址: https://gitcode.com/gh_mirrors/vg/vggt 视觉几何基础Transformer(VGGT)正在重新定义三维场景理…

点大商城系统v2全开源版基础上增加22复制7人成团功能的一些开发经验导图支持(链动n+1功能+排队免单功能+大屏数据)

说明:点大商城已经全开源,全系支持二次开发(功能修改、功能修复、增加功能、模板UI美化)完全按照用户需求进行开发,有功能您尽管提分享最近用户开发案例需求,可能也能给你新脑洞(22复制7人成团)…

【硕士生必看】毕业论文初稿写崩了?Paperzz智能生成+深度查重,助你3天逆袭,导师直呼“这水平够发核心”!

Paperzz-AI官网免费论文查重复率AIGC检测/开题报告/文献综述/论文初稿 https://www.paperzz.cc/dissertationhttps://www.paperzz.cc/dissertation 副标题: 硕士论文不是“写”出来的,是“炼”出来的!Paperzz帮你搞定文献、大纲、生成、查重、…

shell 容器执行脚本有异常时直接退出

shell 容器执行脚本有异常时直接退出# pod.yaml # set -e:当脚本中有命令执行返回非0时,脚本会立即终止执行并异常退出。 # set -u:当脚本中引用了未定义的变量时,脚本会立即终止执行并异常退出。 ... containers:…

【单片机毕业设计】【mcugc-mcu910】基于单片机的温控风扇

一、基本介绍 功能: 1、通过DS1302同步时间,并可修正时间,同时可设定风扇开关时间 2、通过DS18B20检测温度,当温度大于设置最小值,才开启风扇,在最小值和最大值之间,低速转动,大于最…

08cms房产多城市版最新v8.7含小程序及装修网的安装及配置方法整理出来希望能帮到大家

目前市面上很多假货!都是用很早期的版本来冒充,大家要提高警惕!此系统默认已经授权,无域名使用限制了,但是框架特殊 配置也比较陌生,我整理出配置方法分享给大家(另外我这里有所有补丁 从低版本…

彻底掌握pyenv:Shim机制如何让Python版本管理如鱼得水

彻底掌握pyenv:Shim机制如何让Python版本管理如鱼得水 【免费下载链接】pyenv Simple Python version management 项目地址: https://gitcode.com/GitHub_Trending/py/pyenv 你是否曾在多个Python项目间切换时,被版本兼容性问题搞得焦头烂额&…

【博士生必看】博士论文初稿写不动了?Paperzz智能辅助+权威查重,助你突破瓶颈,导师说“这思路可以申基金”!

Paperzz-AI官网免费论文查重复率AIGC检测/开题报告/文献综述/论文初稿 https://www.paperzz.cc/dissertationhttps://www.paperzz.cc/dissertation 副标题: 博士论文不是“熬”出来的,是“智”出来的!Paperzz帮你搞定海量文献、复杂大纲、深度…

记录一次微前端改造:把 10+ 个独立 Vue 项目整合到一起

记录一次微前端改造:把 10 个独立 Vue 项目整合到一起 最近主导了公司前端项目的微前端化改造,踩了不少坑,也有一些收获。趁着记忆还新鲜,把过程记录下来,希望能给有类似需求的同学一些参考。 声明:我也是第…

科技赋能味觉创意 “心语酪印” 西安首秀 打造可定制酸奶消费新场景

当古城西安的千年文脉遇上智能科技的创意火花,一场颠覆传统乳品消费的革新悄然启幕。2025 年 12 月 13 日,西安未央国际核心商圈人流涌动,国内首创智能奶皮子酸奶贩卖机品牌 “心语酪印” 以 “让美好发声” 为主题惊艳亮相。这台打破了 “贩…

ScienceDecrypting完全攻略:三步搞定科研文档解密难题

ScienceDecrypting完全攻略:三步搞定科研文档解密难题 【免费下载链接】ScienceDecrypting 项目地址: https://gitcode.com/gh_mirrors/sc/ScienceDecrypting 还在为那些带有使用期限的科研文档而烦恼吗?ScienceDecrypting正是为你量身打造的解决…

【Java-小程序毕设项目】基于微信小程序的个人健康管理系统+SpringBoot后端实现

【Java-小程序毕设项目】基于微信小程序的个人健康管理系统SpringBoot后端实现 weixin184-基于微信小程序的个人健康管理系统SpringBoot后端实现 文章目录【Java-小程序毕设项目】基于微信小程序的个人健康管理系统SpringBoot后端实现一、内容包括二、运行环境三、需求分析四、…

完整教程:构建AI智能体:九十五、YOLO视觉大模型入门指南:从零开始掌握目标检测

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

Windows系统中msg命令的完整使用方法及相关示例

Windows系统中msg命令的完整使用方法及相关示例 在 Windows 系统中,msg 是内置的命令行工具,用于向本地/远程 Windows 终端会话发送消息。以下是 msg ** 命令的完整使用方法**,包括语法、参数、示例和注意事项,覆盖本地/远程、单…

Velero压缩引擎深度解析:从架构原理到实战调优

Velero压缩引擎深度解析:从架构原理到实战调优 【免费下载链接】velero Backup and migrate Kubernetes applications and their persistent volumes 项目地址: https://gitcode.com/GitHub_Trending/ve/velero 你是否曾经面对Kubernetes集群备份时&#xff…

【大气】大气模型计算不同海拔层的温度、气压、密度和声速Matlab仿真

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。 🍎 往期回顾关注个人主页:Matlab科研工作室 🍊个人信条:格物致知,完整Matlab代码获取及仿…

LookingGlass与OBS集成:实现专业级游戏直播录屏

LookingGlass与OBS集成:实现专业级游戏直播录屏 【免费下载链接】LookingGlass An extremely low latency KVMFR (KVM FrameRelay) implementation for guests with VGA PCI Passthrough. 项目地址: https://gitcode.com/gh_mirrors/lo/LookingGlass Looking…

65、Mono编程入门指南:从基础到GUI应用

Mono编程入门指南:从基础到GUI应用 1. Mono简介与优势 Mono在2011年8月由Xamarin进行了首次正式发布。尽管未来发展未知,但它显然未被弃用。在Linux已有众多编程语言的情况下,使用Mono和.NET仍有诸多理由: - .NET具备“一次编译,到处运行”的特性,能在Linux和Windows间…

如何快速掌握umy-ui:面向Vue开发者的终极性能优化指南

如何快速掌握umy-ui:面向Vue开发者的终极性能优化指南 【免费下载链接】umy-ui umy-ui,一套为开发者准备的基于 Vue 2.0 的桌面端组件库,完美解决表格万级数据渲染卡顿,编辑表格卡顿问题 项目地址: https://gitcode.com/gh_mirr…

Polar靶场-Web中等题目记录(15-32)

ExX? 根据题目,发现存在phpinfo,搜索发现flag很遗憾,flag错误,是假的 没有什么思路,扫描网站目录,发现存在dom.php查看提示,存在xxe漏洞尝试构造利用,读取flag payload: <!DOCTYPE root [ <!ENTITY xx…