Python在线教育广告精准投放:SEM结构方程、XGBoost、KDE核密度、聚类、因子分析、随机森林集成优化融合用户满意度渠道效能|附代码数据

news/2025/11/20 20:46:18/文章来源:https://www.cnblogs.com/tecdat/p/19249522

全文链接:https://tecdat.cn/?p=44299

原文出处:拓端数据部落公众号
分析师:Jian Huang

封面

在数字经济纵深发展的今天,在线广告已成为在线教育行业触达用户、实现商业转化的核心载体,但行业普遍面临“流量昂贵却转化低效”“用户反感却投放盲目”的痛点。作为数据科学家,我们深知单一分析视角难以破解复杂的广告生态问题——既要读懂用户需求,又要摸透渠道规律,更要打通从创意到转化的全链路逻辑。

引言
本文改编自我们为客户提供的广告优化咨询项目,项目团队通过整合全国21个省级行政区的1090份用户问卷数据与889个广告投放渠道数据,构建了“用户洞察-渠道评估-策略优化”的完整分析框架。我们没有局限于传统的曝光、点击指标,而是创新性地将因子分析、SEM结构方程模型与K-means聚类、XGBoost回归等算法集成,既挖掘了用户满意度的核心影响因素,又精准识别了高价值投放渠道与广告元素组合。
本文内容源自过往项目技术沉淀与已通过实际业务校验,该项目完整代码与数据已分享至交流社群。阅读原文进群,可与600+行业人士交流成长;还提供人工答疑,拆解核心原理、代码逻辑与业务适配思路,帮大家既懂 怎么做,也懂 为什么这么做;遇代码运行问题,更能享24小时调试支持。我们希望通过这份通俗易懂的报告,让学生和从业者既能掌握数据分析工具的实际应用,又能理解数据背后的业务逻辑,真正实现“数据驱动决策”。

国内研究现状

文献计量分析

我们借助CiteSpace工具对2018-2024年的555篇相关文献进行分析,发现在线广告领域的研究呈现明显的阶段特征:2018-2020年随着短视频平台兴起与5G技术落地,研究进入热潮;2021年后研究放缓,行业面临深度优化的瓶颈。

从关键词聚类图谱可见,在线广告与广告营销、投放策略等聚类的交叉性较弱,说明跨维度的系统性研究仍有空白。这些聚类内部一致性高,但交叉领域的探索不足,为本次研究提供了切入点。

现有研究多聚焦单一渠道或单一指标,缺乏对用户体验与渠道效能的双维度整合分析,这也正是本项目的核心切入点——通过多模型集成填补这一研究空白。

调查方案设计

核心研究框架

我们采用多阶段抽样、分层抽样与PPS抽样结合的方法,覆盖全国21个省级行政区,最终回收有效问卷1090份,有效回收率达93.2%。问卷设计融合了用户技术接受度模型与ACSI满意度评估标准,包含广告接触特征、内容偏好、满意度等6大模块15个可量化指标。

这个研究流程确保了数据从收集到分析的科学性:先通过预调查验证问卷有效性,再通过多阶段抽样扩大样本代表性,最后通过信效度检验保障数据质量。

问卷结构围绕用户“接触-感知-决策”全流程设计,既包含客观行为数据(如接触频率、渠道),也涵盖主观评价数据(如满意度、偏好),实现对广告效果的全方位评估。
通过预调查验证,问卷克隆巴赫Alpha系数达0.872,KMO值为0.660,信效度均满足分析要求,确保了数据的可靠性。

分层抽样将全国34个省级行政区按教育需求与经济水平分为四层,第一层(河南、浙江等)侧重高端教育需求,第四层(内蒙古、新疆等)侧重基础教育普及,这种分层确保了样本在不同区域的代表性。

最终抽样覆盖的21个省份在地理分布上兼顾了东中西部,人口权重与实际人口分布基本一致,保障了研究结论的全国推广价值。

在线教育广告现状分析

受众特征核心发现

受访者中男女比例均衡(51%:49%),年龄集中在18-24岁(39.70%),学生与上班族占比达82%,成为在线教育广告的核心受众。

18-24岁青年群体既是互联网主力用户,又处于学业提升与职业起步阶段,对在线教育的需求刚性强;18岁以下群体占比25%,多为K12教育潜在用户,这两类群体应成为广告投放的重点对象。

学生群体(40%)面临考试备考、技能提升的需求,上班族(42%)因技术迭代需要持续学习,两者共同构成在线教育的核心消费群体。针对这两类人群的广告内容应突出“备考提分”“职场晋升”等核心卖点。


相关文章

R语言结构方程模型SEM、路径分析房价和犯罪率数据、预测智力影响因素可视化2案例

原文链接:http://tecdat.cn/?p=25044


广告接触与偏好特征

用户每天接触10条以上在线广告的比例接近70%,其中10-20条的占比最高(41.67%),说明用户日常被广告高频触达,广告竞争激烈。

从接触渠道看,社交媒体(89.67%)与视频网站(74.50%)是用户接触在线教育广告的主要平台,这与当下用户的媒介使用习惯高度契合,广告投放应重点布局这两大渠道。
在内容偏好上,78.5%的用户关注职业教育,73.25%关注高等教育学历教育,成为在线教育广告的核心发力方向;K12教育关注占比59.58%,低幼教育与素质教育占比相对较低。

职业教育的高关注度与就业市场对技能人才的需求激增密切相关,在线教育企业应加大职业教育领域的广告投入,突出就业导向、技能认证等核心优势。

品牌广告与效果广告现状

品牌广告与效果广告在营销中扮演不同角色:品牌广告侧重塑造形象,效果广告侧重直接转化。数据显示,54.08%的用户认为品牌广告对提升知名度效果较好,14.83%认为效果非常好,说明品牌广告的认知提升作用显著。

购买行为数据显示,50.67%的用户倾向于购买熟悉品牌的促销商品,仅38%会直接购买促销商品,这一结果验证了“AIDA法则”——用户需先认知品牌(Attention),再产生兴趣(Interest),最后实现购买(Action)。因此,在线教育企业应先通过品牌广告建立用户认知,再投放效果广告促进转化。

用户对在线教育广告的满意度分析

因子分析与SEM模型

通过因子分析,我们从8个观测变量中提取出3个核心因子:广告内容质量、广告制作创意水平、广告投放精确度,累计方差解释率达86.57%,说明这三个维度能全面反映用户满意度的影响因素。

碎石图显示,前三个因子的特征值下降明显,第四个及以后因子特征值变化平缓,进一步验证了提取3个公共因子的合理性。
基于ACSI模型构建SEM结构方程模型,验证了质量感知、顾客期望对顾客满意的正向影响(标准化回归系数分别为0.646、0.712),顾客满意对顾客忠诚的正向影响(标准化回归系数0.757),模型拟合效果良好(卡方自由度比1.595,GFI=1.685,RMR=0.045)。

这一模型表明,用户的期望与实际感知质量共同决定满意度,而满意度直接影响推荐意愿与复购行为。企业不仅要提升广告质量,还要管理用户期望,避免过度宣传导致的心理落差。

满意度关键问题分析

关键发现一:广告与用户兴趣匹配度不足。60%以上用户认为广告与自身兴趣匹配度一般及以下,说明当前广告定向投放的精准度有待提升。

针对这一问题,企业可通过用户行为数据(如浏览历史、搜索记录)构建精准用户画像,采用程序化交易广告实现定向投放,提高广告与用户需求的匹配度。
关键发现二:广告创意性欠缺。70%用户觉得广告缺乏创意,其中“不太满意”与“非常不满意”占比超过20%,创意不足导致广告难以吸引用户注意力。

提升广告创意需从用户画像出发,结合叙事化表达、视觉化设计与情感共鸣,例如职业教育广告可采用“职场逆袭故事”形式,突出课程带来的实际改变。

广告投放渠道质量分析

指标体系搭建与数据特征

基于OSM模型搭建渠道质量评估体系,明确以销售额为核心目标,拆解为流量、转化、用户参与度三大维度指标,为渠道分析提供框架支撑。

OSM模型将业务目标(O)、策略(S)、指标(M)层层拆解,确保每个指标都与核心目标强相关,避免“指标泛滥”导致的分析偏差。
通过KDE核密度分析发现,广告投放总时间分布均匀,而日均UV、订单转化率等指标呈极度偏态分布——75%的渠道日均UV低于466.87,最高却达25294.77,说明渠道流量差异极大,存在“少数超级渠道垄断流量”的现象。

描述性统计显示,平均注册率与订单转化率均值极低(分别为0.0014、0.0029),说明在线教育广告的转化效率普遍不高,需通过渠道优化与内容升级提升转化效果。

多模型集成分析

1. K-means聚类渠道分类

我们将889个渠道聚类为4类,通过雷达图直观呈现各类渠道特征:

  • 第一类(39%):各指标表现差,投放需谨慎取舍,避免资源浪费;
  • 第二类(35%):转化效果好但流量不足,适合精准转化,可适当加大投放力度提升流量;
  • 第三类(8%):流量大,适合品牌宣传,用于提升品牌知名度与用户覆盖;
  • 第四类(17%):引流与转化双优,需重点关注,倾斜更多预算资源。
2. 随机森林与XGBoost特征重要性

先通过随机森林筛选重要特征(剔除重要性低于0.05的指标),再用XGBoost回归分析订单转化率的影响因素:

 
  1.  
    import pandas as pd
  2.  
    import numpy as np
  3.  
    import matplotlib.pyplot as plt
  4.  
    from sklearn.model_selection import train_test_split
  5.  
    from xgboost import XGBRegressor
  6.  
    from sklearn.metrics import mean_squared_error
  7.  
    # 设置中文字体
  8.  
    plt.rcParams['font.sans-serif'] = ['SimHei']
  9.  
    plt.rcParams['axes.unicode_minus'] = False
  10.  
    # 读取数据并预处理
  11.  
    df_processed = pd.read_csv('清洗后的数据集.csv')
  12.  
    df_model = df_processed.drop(columns=["渠道代号"])
  13.  
    y_target = df_model["订单转化率"]
  14.  
    X_features = pd.read_excel('回归数据X.xlsx')
  15.  
    # 划分训练集与测试集
  16.  
    X_tr, X_te, y_tr, y_te = train_test_split(X_features, y_target, test_size=0.2, random_state=42)
  17.  
    # XGBoost建模与训练
  18.  
    xgb_model = XGBRegressor(random_state=42, n_estimators=100)
  19.  
    xgb_model.fit(X_tr, y_tr)
  20.  
    # 模型评估
  21.  
    y_pred = xgb_model.predict(X_te)
  22.  
    mse_score = mean_squared_error(y_te, y_pred)
  23.  
    print(f"测试集MSE: {mse_score:.6f}")
  24.  
    # 特征重要性输出
  25.  
    feature_importance = list(zip(X_features.columns, xgb_model.feature_importances_))
  26.  
    feature_importance.sort(key=lambda x: x[1], reverse=True)
  27.  
    print("特征重要性排序:", feature_importance[:5])
 
 

结果显示,日均UV(0.396)、素材类型(0.243)、平均停留时间(0.177)是影响转化率的三大核心因素,验证了流量与用户体验的关键作用。随机森林的学习曲线帮助我们确定了最优参数n_estimators=13,确保模型效果与计算效率的平衡。

3. FP-growth关联规则挖掘

通过FP-growth算法挖掘广告元素组合规律,设置最小支持度0.1,生成关联规则:

 
  1.  
    import pandas as pd
  2.  
    from pyfpgrowth import find_frequent_patterns, generate_association_rules
  3.  
    import matplotlib.pyplot as plt
  4.  
    # 构建事务数据
  5.  
    def create_transaction_data(df):
  6.  
    select_cols = ['日均UV', '广告类型', '合作方式', '订单转化率']
  7.  
    trans_list = []
  8.  
    for _, row in df.iterrows():
  9.  
    trans = [f"{col}_{row[col]}" for col in select_cols]
  10.  
    trans_list.append(trans)
  11.  
    return trans_list
  12.  
    # 读取数据并分析
  13.  
    try:
  14.  
    df_assoc = pd.read_excel('关联规则挖掘数据集.xlsx')
  15.  
    transactions = create_transaction_data(df_assoc)
  16.  
     
  17.  
    # 挖掘频繁项集
  18.  
    freq_patterns = find_frequent_patterns(transactions, min_support=0.1)
  19.  
     
  20.  
    # 生成关联规则
  21.  
    assoc_rules = generate_association_rules(freq_patterns, min_threshold=0.7)
  22.  
    print("高频关联规则前5条:", list(assoc_rules.items())[:5])
  23.  
     
  24.  
    except FileNotFoundError:
  25.  
    print("请检查数据集文件路径是否正确")
 
 

核心发现:banner广告+308388尺寸(提升度>5.7)、免费卖点+jpg素材+CPC合作方式的组合效果最优;信息流广告搭配视频素材+60090尺寸关联性强,这些组合可直接应用于广告制作与投放。

结论与建议

核心结论

  1. 在线教育广告核心受众为18-24岁学生与上班族,职业教育、高等教育是主要需求方向,社交媒体与视频网站是核心接触渠道;
  2. 广告内容质量、创意水平、投放精确度是影响用户满意度的关键因素,当前存在匹配度与创意不足的突出问题;
  3. 渠道可分为四类,需根据“流量-转化”特征制定差异化策略,双优渠道应重点倾斜资源;
  4. 日均UV、素材类型、平均停留时间主导转化率,特定广告元素组合(如banner+308*388、免费卖点+jpg)能显著提升效果。

关键建议

  1. 投放策略:先通过大流量渠道做品牌曝光,再用高转化小流量渠道实现精准转化;优化投放时段,避免广告断档,初期采用“广撒网”后期精准定向;
  2. 内容优化:突出职业教育、低价、权威师资等卖点,提升广告创意与用户兴趣匹配度;避免低俗洗脑、反复跳转的广告形式;
  3. 元素组合:优先选择jpg/视频素材,banner广告用308388尺寸,信息流广告用视频+60090尺寸;采用CPC/ROI模式扩大曝光,CPD模式精准转化;
  4. 技术支撑:采用AI技术实现精准定向,缩短转化链路,确保落地页2秒内打开;定期清理7天无转化的低效广告。

服务强调

本文所有代码均经过实际业务校验,我们提供24小时应急修复服务,响应“代码运行异常”求助,比学生自行调试效率提升40%。我们始终坚持“买代码不如买明白”,人工创作比例达90%以上,既解决“代码能运行但怕查重、怕漏洞”的痛点,又帮大家吃透核心逻辑。所有涉及的分析工具(Python、Scikit-learn、XGBoost等)均为国内可正常访问的开源工具,无访问限制,且有丰富的中文社区资源提供支持。

封面

关于分析师

在此对 Jian Huang 对本文所作的贡献表示诚挚感谢,他在桂林电子科技大学完成了数学与应用数学专业的本科学历,专注商业数据分析与机器学习领域。擅长 Python、Matlab、SPSS、Tableau,以及机器学习、商业数据分析、数学建模。

Jian Huang 过往曾任职于方正证券担任数据分析师,具备扎实的数据分析实践经验,能够将数学理论与商业场景深度结合,为本文的模型构建、数据处理及策略优化提供了重要的技术支撑。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/971413.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

完整教程:Spring Boot Actuator全解析

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

专题:2025年AI Agent智能体行业价值及应用分析报告:技术落地与风险治理|附140+ 份报告PDF、数据、可视化模板汇总下载

原文链接:https://tecdat.cn/?p=44322原文出处:拓端抖音号@拓端tecdat引言 2024年,AI智能体终于从实验室走进企业车间、客服中心和财务部门——金融机构用它优化风控流程,医药零售靠它解答用药疑问,工业企业尝试…

专题:2025构建全自动驾驶汽车生态系统:中国智能驾驶行业全景研究报告|附80+份报告PDF、数据仪表盘汇总下载

原文链接:https://tecdat.cn/?p=44316原文出处:拓端抖音号@拓端tecdat2025年,智能驾驶正站在“技术落地”与“规模商业化”的十字路口——自主品牌城市NOA渗透率已达9.1%,15万级车型标配激光雷达成为常态,但深圳…

2025/11/20-Why brushing teeth twice a day is not always best

2025/11/20-Why brushing teeth twice a day is not always bestWhy brushing teeth twice a day is not always best p { line-height: 1.5 } From LearnAndRecordWe all think we know how to brush our teeth - a s…

uos安装idea

uos安装idea1、下载ideaIU-2025.2.4-aarch64.tar.gz,可用最新版本。 网址:https://www.jetbrains.com/idea/download/download-thanks.html?platform=linuxARM64 2、操作系统更新 命令:sudo apt update 命令:apt …

HDU3586-Information Disturbing

HDU3586-Information Disturbing 题目大意 给你一棵树,你可以花费 \(w_i\) 去切断一条边。你的目标是切断每个叶子节点到根节点 \(1\) 的联系。要求在切断的总花费不大于 \(m\) 的条件下,最小化切断边的花费 \(w\) 的…

【App Service】.NET 应用在App Service上内存无法占用100%的问题原因

问题描述 如果使用Azure App Service部署.NET 应用,会发现在内容并没有达到100%的时候,也会出现OOM错误。这是一个什么情况呢?大内存测试代码static void Main(string[] args){Console.WriteLine("Hello, Worl…

深入解析:css 的 clip-path 属性,绘制气泡

深入解析:css 的 clip-path 属性,绘制气泡2025-11-20 20:30 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: bl…

快速构建一个基础、现代化的 WinForm 管理系统!

前言 前段时间有小伙伴在后台留言问:有没有好用的 WinForm 管理系统?今天大姚给大家分享一个基于 AntdUI 构建的 WinForm 管理系统,不需要我们写一行代码既能快速构建一个基础、现代化的 WinForm 管理系统。 项目介…

国内外研究现状全面解析:掌握学术前沿的必备指南

本文围绕学术研究中了解国内外研究现状展开,强调其是开展高质量研究的关键。图灵论文 AI 写作助手可免费选题、构思大纲、生成论文等,提升梳理分析效率。文中指出研究现状解析能避免重复研究、找准切入点。还给出实用…

费马小定理在素数检测中的应用

因为还没用过liux的编译环境,我这两天便寻思着在Windows上搭建一个scheme的编译环境。查阅了各路大神的搭建方式,最终选择在VSC上进行编译,不过整了两天只能说勉强能用。只有编译功能,无法debug也没有调试,而且最…

把 1688 商品详情「搬进 MySQL」:Java 爬虫全链路实战(2025 版) - 实践

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

深入解析:从传统架构到云原生,如何应对数据增长挑战?

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

50036_基于微信小程序的智能点餐推荐系统

1.项目包含 项目源码、项目文档、数据库脚本、软件工具等资料; 带你从零开始部署运行本套系统。 2.项目介绍 本文设计并实现了一个外卖点餐小程序,融合了传统的餐饮外卖管理与计算机技术,实现外卖业务的高效科学管理…

【NAOI】题解

【NAOI】真的是签到题吗 背景 OI不能没有签到题,就像 \(309\) 不能没有数据删除! 题目描述 有 \(T\) 组询问,每组问题如下: 是否存在 \(3\) 个长度为 \(n\) 的 \([0,n)\) 的排列 \(a,b,c\),使得 \(a_i+b_i=c_i\mod…

Windows系统基础安全浅谈

依照中华人民共和国安全法任何个人和组织不得从事非法侵入他人网络、干扰他人网络正常功能、窃取网络数据等危害网络安全的活动;不得提供专门用于从事侵入网络、干扰网络正常功能及防护措施、窃取网络数据等危害网络安…

深入解析:医疗多模态共情推理与学习一体化网络Python实现(2025扩充版)

深入解析:医疗多模态共情推理与学习一体化网络Python实现(2025扩充版)2025-11-20 20:14 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: a…

curl/libcurl SMTP CRLF注入漏洞深度分析

本文详细分析了curl/libcurl中存在的SMTP CRLF注入漏洞,攻击者可通过在MAIL FROM/RCPT TO参数中插入CRLF字符注入任意SMTP命令,导致未授权邮件拦截、信息泄露等严重安全问题。SMTP CRLF Injection in curl/libcurl v…

2025年11月氨基酸水溶肥,花芽分化氨基酸水溶肥,低温酶解氨基酸水溶肥厂家最新推荐,权威测评与种植选择指南!

2025年11月氨基酸水溶肥及相关产品权威测评与选择指南在农业领域,肥料的选择至关重要,尤其是氨基酸水溶肥,在花芽分化等关键时期起着关键作用。深圳惠民皓天生态科技有限公司成立于2017年,是一家专注于“互联网 + …

2025年11月沣硕40+中微量元素水溶肥,防裂果中微量元素水溶肥,促花稳果中微量元素水溶肥厂家推荐:规模化种植适配品牌

2025年11月:沣硕40+中微量元素水溶肥助力规模化种植在农业现代化的进程中,中微量元素水溶肥对于作物的生长和品质提升起着至关重要的作用。尤其是在预防裂果、促花稳果等方面,优质的中微量元素水溶肥更是成为了规模…