中国营销网站启信聚客通网络营销策划

news/2025/9/30 0:39:52/文章来源:
中国营销网站,启信聚客通网络营销策划,做购物网站骗人,破解直播免费视频目录 一、朴素贝叶斯分类理论 1、贝叶斯分类理论 2、条件概率 3、全概率公式 4、贝叶斯推断 5、朴素贝叶斯推断 6、拉普拉斯平滑系数 二、决策树分类 1、相关概念 2、基于信息增益决策树的建立 3、基于基尼指数决策树的建立 一、朴素贝叶斯分类理论 1、贝叶斯分类理…目录 一、朴素贝叶斯分类理论 1、贝叶斯分类理论 2、条件概率 3、全概率公式 4、贝叶斯推断 5、朴素贝叶斯推断 6、拉普拉斯平滑系数 二、决策树分类 1、相关概念 2、基于信息增益决策树的建立 3、基于基尼指数决策树的建立 一、朴素贝叶斯分类理论 1、贝叶斯分类理论 假设一个数据集它由两类数据组成数据分布如下图所示 p1(x,y)表示数据点(x,y)属于类别1图中红点 p2(x,y)表示数据点(x,y)属于类别2图中蓝点 那么对于一个新数据点 (x,y) 如果p1(x,y)p2(x,y)那么类别为1 如果p1(x,y)p2(x,y)那么类别为2 也就是说我们会选择高概率对应的类别。这就是贝叶斯决策理论的核心思想即选择具有最高概率的决策。 2、条件概率 条件概率(Conditional probability)就是指在事件B发生的情况下事件A发生的概率用P(A|B)来表示。 由事件A、事件B同时发生的概率等于事件B发生的概率乘以事件B发生中事件A也发生的概率即(∩)(|)()同理(∩)(|)()。 得出(|)(|)()/()即条件概率的计算公式。 3、全概率公式 由公式 ()(∩)(∩′)代入(∩)(|)()得到全概率公式()(|)()(|′)(′)再代入条件概率的计算公式 4、贝叶斯推断 (|)(|)()/()中 (|)是后验概率(Posterior probability)可理解为在观察证据 B 时假设 A 发生的概率 (|)是似然度即在假设 A 成立的条件下观察到证据 B 的概率 ()是先验概率(Prior probability)即在没有观察到任何证据前假设 A 成立的概率 ()是边缘概率即观察到证据 B 的概率可以视为归一化常量 (|)/()称为可能性函数(Likelyhood)这是一个调整因子使得预估概率更接近真实概率。 所以条件概率可以理解为后验概率先验概率调整因子 我们先预估一个先验概率然后加入实验结果看这个实验到底是增强还是削弱了先验概率由此得到更接近事实的后验概率。 5、朴素贝叶斯推断 贝叶斯和朴素贝叶斯的概念是不同的区别就在于“朴素”二字朴素贝叶斯对条件概率分布做了条件独立性的假设。 比如下面的公式假设有n个特征 根据贝叶斯定理后验概率 P(a|X) 可以表示为(a|X)(X|a)(a)/(X)将联合概率 P(X|a) 分解为各个特征的概率乘积 将这个条件独立性假设应用于贝叶斯公式得到 这样朴素贝叶斯分类器就可以通过计算每种可能类别的条件概率和先验概率然后选择具有最高概率的类别作为预测结果。   6、拉普拉斯平滑系数 某些事件或特征可能从未出现过这会导致它们的概率被估计为零。然而在实际应用中即使某个事件或特征没有出现在训练集中也不能完全排除它在未来样本中出现的可能性。拉普拉斯平滑技术可以避免这种“零概率陷阱”。 一般α取值1m的值为总特征数。 通过这种方法即使某个特征在训练集中从未出现过它的概率也不会被估计为零而是会被赋予一个很小但非零的值从而避免了模型在面对新数据时可能出现的过拟合或预测错误。 api: # 朴素贝叶斯算法 sklearn.naive_bayes.MultinomialNB() estimator.fit(x_train, y_train) y_predict estimator.predict(x_test) # 鸢尾花数据集 贝叶斯分类 from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.naive_bayes import MultinomialNB# 加载数据 x,y load_iris(return_X_yTrue) # 划分数据 x_train,x_test,y_trian,y_test train_test_split(x,y,train_size0.8) # 处理数据 不用标准化 # 初始化贝叶斯预估器 estimator MultinomialNB() # 训练模型 estimator.fit(x_train,y_train) # 评估模型 score estimator.score(x_test,y_test) print(score) # 泰坦尼克号数据集 贝叶斯分类 from sklearn.naive_bayes import MultinomialNB from sklearn.model_selection import train_test_split from sklearn.feature_extraction import DictVectorizer import pandas as pddata pd.read_csv(../src/titanic/titanic.csv) x data[[pclass,age,sex]] # 众数填充age的缺省值 x[age].fillna(x[age].value_counts().index[0],inplaceTrue) # 将sex特征下的male和female转换为0和1 x[sex] [0 if imale else 1 for i in x[sex]] x[pclass][int(i[0]) for i in x[pclass]] print(x)y data[[survived]]# 划分数据 x_train,x_test,y_train,y_testtrain_test_split(x,y,train_size0.8,random_state100) # 初始化朴素贝叶斯预估器 estimator MultinomialNB() # 训练模型 estimator.fit(x_train,y_train) # 评估模型 score estimator.score(x_test,y_test) print(score) # 预测 y_predict estimator.predict([[1,30,1]]) print(y_predict)二、决策树分类 1、相关概念 1.决策节点 通过条件判断而进行分支选择的节点。如将某个样本中的属性值(特征值)与决策节点上的值进行比较从而判断它的流向。 2.叶子节点 没有子节点的节点表示最终的决策结果。 3.决策树的深度 所有节点的最大层次数。决策树具有一定的层次结构根节点的层次数定为0从下面开始每一层子节点层次数增加。 4.决策树优点 可视化-可解释能力-对算力要求低 5.决策树缺点 容易产生过拟合所以应避免调整过大的深度。 2、基于信息增益决策树的建立 信息增益决策树倾向于选择取值较多的属性在有些情况下这类属性可能不会提供太多有价值的信息算法只能对描述属性为离散型属性的数据集构造决策树。 1.信息熵 信息熵描述的是不确定性。信息熵越大不确定性越大。信息熵的值越小则D的纯度越高。 假设样本集合D共有N类第k类样本所占比例为pk则D的信息熵为 2.信息增益 信息增益是一个统计量用来描述一个属性区分数据样本的能力。信息增益越大那么决策树就会越简洁。 这里信息增益的程度用信息熵的变化程度来衡量, 信息增益公式 3.建立步骤 计算根节点的信息熵---计算属性的信息增益---划分属性 3、基于基尼指数决策树的建立 基尼指数(Gini Index)是决策树算法中用于评估数据集纯度的一种度量基尼指数衡量的是数据集的不纯度或者说分类的不确定性。 对于多分类问题如果一个节点包含的样本属于第 k 类的概率是 pk则节点的基尼指数定义为 意义 当一个节点的所有样本都属于同一类别时基尼指数为 0表示纯度最高。 当一个节点的样本均匀分布在所有类别时基尼指数最大表示纯度最低。 应用 在构建决策树时我们希望每个内部节点的子节点能更纯即基尼指数更小。因此选择分割特征和分割点的目标是使子节点的平均基尼指数最小化。 具体来说对于一个特征我们计算其所有可能的分割点对应的子节点的加权平均基尼指数然后选择最小化这个值的分割点。这个过程会在所有特征中重复直到找到最佳的分割特征和分割点。 例如考虑一个数据集 (D)其中包含 (N) 个样本特征 (A) 将数据集分割为 |D_1|和 |D_2| 则特征 (A) 的基尼指数为 其中 |D_1|和 |D_2| 分别是子集 D_1 和 D_2 中的样本数量。 通过这样的方式决策树算法逐步构建一棵树每一层的节点都尽可能地减少基尼指数最终达到对数据集的有效分类。 api: sklearn.tree.DecisionTreeClassifier(....) 参数 criterion gini entropy” 默认为gini     当criterion取值为gini时采用 基尼不纯度Gini impurity算法构造决策树     当criterion取值为entropy”时采用信息增益 information gain算法构造决策树. max_depth   int, 默认为None  树的最大深度 可视化决策树 sklearn.tree.export_graphviz(estimator, out_fileiris_tree.dot, feature_namesiris.feature_names) 参数     estimator决策树预估器     out_file生成的文档     feature_names节点特征属性名 功能:     把生成的文档打开复制出内容粘贴到http://webgraphviz.com/中点击generate Graph会生成一个树型的决策树图 # 鸢尾花数据集 使用信息增益算法构造决策树 from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.tree import DecisionTreeClassifier,export_graphviziris load_iris() x,y load_iris(return_X_yTrue)x_train,x_test,y_train,y_test train_test_split(x,y,train_size0.75)scaler StandardScaler() x_train scaler.fit_transform(x_train) x_test scaler.transform(x_test)# critierionentropuy 采用信息增益算法构建决策树 (criterion默认为gini 采用基尼不纯度算法构造决策树) estimator DecisionTreeClassifier(criterionentropuy) estimator.fit(x_train,y_trian)score estimator.score(x_test,y_test) print(score)y_predict estimator.predict([[2,2,3,1],[3,5,4,7]]) print(y_predict)# 可视化决策树 # export_graphviz(estimator, out_file../model/iris_tree.dot, feature_namesiris.feature_names)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/922371.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网站在正在建设中崇义县网站建设

JMS规范 一、JMS是什么二、MQ中间件对比三、JMS组成1.JMS Provider2.JMS Producer3.JMS Consumer4.JSM Message4.1 消息头4.2 消息体4.2.1 生产者4.2.2 消费者 4.3 消息属性 四、JMS可靠性1.PERSISTENT - 持久化1.1 参数设置1.2 Queue持久化1.3 Topic持久化1.3.1 持久的发布主题…

免费发布推广信息网站asp.net网站开发菜鸟

一.新建工程模板(基于固件库) 1.1库函数与寄存器的区别 这里的启动文件都是根据容量来进行区分的 对MDK而言即使include了,也不知道在哪里找头文件 STM32F10X_HD,USE_STDPERIPH_DRIVER 二.新建工程模板(基于寄存器) 上面的大部分配置与固件库的一样 具体可以看手…

简单的视频网站能不能用dw做北京企业建站程序

目录 环境描述 分析过程 1.SD卡格式化 2.使用winhex打开sd卡 3.MBR分析 4.DBR分析

广州响应式网站建设南京网站开发南京乐识权威

前言 上一篇:从领域驱动到模型驱动中我们讨论到,领域驱动设计的核心思想是保持业务-模型-代码的一致性,模型作为沟通业务和代码的工具,至关重要,今天这篇文章就来讨论DDD中建模的一些思考和方法。 什么是建模 虽然看…

天津网站建设公司推荐学电脑哪家好

性能优化是一个很有趣的探索方向,将耗时耗资源的查询优化下来也是一件很有成就感的事情,但既然编程是一种沟通手段,那每一个数据开发者就都有义务保证写出的代码逻辑清晰,具有很好的可读性。 目录 引子 小试牛刀 答案 引言 …

网站建设案例怎么样做淘宝客网站服务器

目录 1.网络编程 2.Echo模型(服务器与客户端实现通信) 3.BIO处理模型(实现多用户访问同个服务器) 4.UDP程序 1.网络编程 有两种通信模型 C/S(Client/Server)基于客户端和服务器端,实现代码时候需要实现客户端与服务器端 B/S(Browser/S…

大二学计算机系统基础

大二学计算机系统基础平台:IA-64 + linux + C + gcc在 linux 系统中:gdb 在 Macintosh OS 上:lldb编译器:以机器码为目标 操作系统:管理进程状态x86-64(又称 x64、AMD64) x86 架构的 64 位扩展 指令集的 64位版…

目前哪些企业需要做网站建设的呢w7系统那个网站做的好

我相信命理,但我不相信在床脚钉四个铜钱就可以保证婚姻幸福、白首偕老。 我相信风水,但我不相信挂一个风铃、摆一个鱼缸就可以使人财运亨通、官禄无碍。 我相信人与环境中有一些神秘的对应关系,但我不相信一个人走路时先跨走左脚或右脚就可以…

阿里云模板建站教程网站的种类

常数 值 描述 vbCr Chr(13) 回车符。 vbCrLf Chr(13) & Chr(10) 回车符与换行符。 vbFormFeed Chr(12) 换页符;在 Microsoft Windows 中不适用。 vbLf Chr(10) 换行符。 vbNewLine Chr(13) & Chr(10) 或 Chr(10) 平台指定的新行字符;适用于…

免费做网站app怎么做页面跳转

参考链接&#xff1a; 反转Java中的字符串String 一、java字符串的反转 1.利用java字符串的拼接实现字符串的反转&#xff0c;代码如下&#xff1a; public static String reverse(String s){ int lens.length(); String str""; for (int i 0; i < len; i) { …

20250929 之所思 - 人生如梦

20250929 之所思最近事情发生的有点多,思绪有点混乱。9.23 台风来临,9.24 居家办公一天;9.27日因为26日晚没有控制好时间几乎通宵,迷迷糊糊的度过了一天,9.28日又补班,整个节奏很混乱,加上最近休假的同事特别多…

9/29

今日学习了Java中的出题系统,使用了子方法的方法写代码,让我收获颇丰,明日继续

聊城专业建网站价格中国建设银行官网站住房公积金

Redis 作为一个高性能的分布式缓存系统,广泛应用于后端开发中,因此在后端研发面试中,关于 Redis 的问题十分常见。 本文整理了30个常见的 Redis 面试题目,涵盖了 Redis 的源码、数据结构、原理、集群模式等方面的知识,并附上简要的回答,帮助大家更好地准备相关的面试。 …

9.9元包邮网站怎么做昆明做网站的网络公司

首先&#xff0c;先介绍两种引入模块的方法。 法一&#xff1a;将整个文件引入 import 文件名 文件名.函数名( ) / 文件名.类名 通过这个方法可以运行另外一个文件里的函数 法二&#xff1a;只引入某个文件中一个类/函数/变量 需要从某个文件中引入多个函数或变量时&#xff0c…

河南网站排名优化wordpress 响应速度

文章目录 切片的诞生&#xff1a;数组的延伸切片的结构初始化切片 切片的内存管理扩容机制 实例分析&#xff1a;切片的动态特性切片与性能性能对比 切片的并发安全并发场景下的切片操作 切片与接口切片与空接口 切片的遍历与操作遍历切片切片的切片操作 切片的垃圾回收切片的生…

昆山科技网站建设达州网站建设公司

为了使用你提到的封装方式来创建一个包含多个 Data 对象的列表并使用 DataLoader 来加载这些数据&#xff0c;我们可以按照以下步骤进行&#xff1a; 创建数据&#xff1a;生成节点特征矩阵、边索引矩阵和标签。封装数据&#xff1a;使用 Data 对象将这些数据封装起来。使用 D…

怎么制作学校网站徐州百姓网

防水涂料和施工堵漏的“五大技巧”和“九个细节”很多业主会在留言里问我家里水管堵了、房顶渗水怎么办&#xff0c;所以防水问题不可忽视。让您住的安心&#xff0c;您楼下的邻居也住的安心。对于防水问题&#xff0c;一定要在最初进行装修的时候就特别注意。下面这些是专业人…

如何设计个人网站响应式网站和自适应

前情回顾&#xff1a;i操作并不是原子操作&#xff0c;因此多线程下会达不到预期的效果&#xff0c;需要通过加锁或AtomicInteger或LongAdder等方法来实现。 i可以分为三步 我们通过实验来观察实现i操作的方式。 下面实验中通过继承Thread实现了多线程 错误方法&#xff1a;…

网上工伤做实网站做网站都要掌握什么

文章目录 分布式IDUUIDSnowflake算法数据库自增IDLeaf算法Redis自增ID 分布式ID 在我们业务数据量不大的时候&#xff0c;单库单表完全可以支撑现有业务&#xff0c;数据再大一点搞个MySQL主从同步读写分离也能对付。但随着数据日渐增长&#xff0c;主从同步也扛不住了&#x…