机器学习---最大似然估计和贝叶斯参数估计

1. 估计

贝叶斯框架下的数据收集,在以下条件下我们可以设计一个可选择的分类器 :

P(wi) (先验);P(x | wi) (类条件密度)

但是。我们很少能够完整的得到这些信息!

从一个传统的样本中设计一个分类器:

先验估计不成问题

对类条件密度的估计存在两个问题:1)样本对于类条件估计太少了;2 特征空间维数太大

了,计算复杂度太高。

如果可以将类条件密度参数化,则可以显著降低难度。

例如:P(x | wi)的正态性,P(x | wi) ~ N( mi, Si),用两个参数表示,这样就将概率密度估计问题转

化为参数估计问题。

最大似然估计 (ML) 和贝叶斯估计;结果通常很接近, 但是方法本质是不同的。

最大似然估计将参数看作是确定的量,只是其值是未知!  通过最大化所观察的样本概率得到最优的

参数—用分析方法。

贝叶斯方法把参数当成服从某种先验概率分布的随机变量,对样本进行观测的过程,就是把先验概

率密度转化成为后验概率密度,使得对于每个新样本,后验概率密度函数在待估参数的真实值附近

形成最大尖峰。在参数估计完后,两种方法都用后验概率P(wi | x)表示分类准则!

2. 最大似然估计  

最大似然估计的优点:当样本数目增加时,收敛性质会更好; 比其他可选择的技术更加简单。

2.1 基本原理

假设有c类样本,并且每个样本集的样本都是独立同分布的随机变量;P(x | wj) 形式已知但参数未

知,例如P(x | wj) ~ N( mj, Sj);记 P(x | wj) º P (x | wj, qj),其中

使用训练样本提供的信息估计θ = (θ1, θ2, …, θc), 每个 θi (i = 1, 2, …, c) 和每一类相关

假定D包括n个样本, x1, x2,…, xn,

θ的最大似然估计是通过定义最大化P(D | θ)的值θ值与实际观察中的训练样本最相符”

最优估计:令并令为梯度算子,the gradient operator

我们定义 l(θ) 为对数似然函数:l(θ) = ln P(D | θ)

新问题陈述:求解 θ 为使对数似然最大的值    

对数似然函数l(θθ)显然是依赖于样本集D, 有:

最优求解条件如下:

,来求解。

2.2 高斯情况:μ未知

P(xk | μ) ~ N(μ​​​​​​​, Σ):(样本从一组多变量正态分布中提取)

θ = μ,因此:μ的最大似然估计必须满足 

Σ并且重新排序, 我们得到:即训练样本的算术平均值!

结论:如果P(xk | wj) (j = 1, 2, …, c)被假定为维特征空间中的高斯分布;然后我们能够估计向量

 从而得到最优分类!

2.3 高斯情况:μ​​​​​​​和Σ未知

未知 μ​​​​​​​  σ对于单样本xk:θ = (θ1, θ2) = (μ, σ2)

对于全部样本,最后得到:

联合公式 (1) (2), 得到如下结果:

3. 贝叶斯估计 

在最大似然估计中 θ 被假定为固定值;在贝叶斯估计中 θ 是随机变量

3.1 类条件密度

目标: 计算 P(wi | x, D),假设样本为D贝叶斯方程可以写成

先验概率通常可以事先获得,因此

每个样本只依赖于所属的类,有:

即:只要在每类中,独立计算就可以确定x的类别。

因此,核心工作就是要估计

3.2 参数分布

假设  的形式已知, 参数θ的值未知,因此条件概率密度 的函数形式是知道的;假设参

数q是随机变量,先验概率密度函数p(θ)已知,利用贝叶斯公式可以计算后验概率密度函数p(θ|D)

希望后验概率密度函数p(θ | D) 在θ的真实值附件有非常显著的尖峰,则可以使用后验密度p(θ | D)

估计 θ ;注意到:

如果p(θ|D) 在某个值附件有非常显著的尖峰,即如果条件概率密度具有一个已知的形式,则利

用已有的训练样本,就能够通过p(θ | D) 对p(x | D) 进行估计。

 3.3 高斯过程

单变量情形的 p(μ | D)

复制密度:

其中: 

结论:

单变量情形的 p(x|D):

 多变量情形:

复制密度: 

其中:

利用:

得:

利用:,令y=x-μ​​​​​​​。

4. 贝叶斯参数估计一般理论 

p(x | D) 的计算可推广于所有能参数化未知密度的情况中,基本假设如下:

假定 p(x | θ) 的形式未知,但是q的值未知。q被假定为满足一个已知的先验密度 P(θ)。

其余的 θ 的信息包含在集合D中,其中D是由n维随机变量x1, x2, …, xn组成的集合,它们服从于概

率密度函数p(x)

基本的问题是:计算先验密度p(θ | D) ,然后 推导出 p(x | D)。

递归贝叶斯学习:

该过程称为参数估计的递归贝叶斯方法,一种增量学习方法。

唯一性问题:

p(x|θ) 是唯一的:后验概率序列 p(θ|Dn) 收敛到 delta 函数;只要训练样本足够多,则 p(x|θ) 能唯

一确定θ

在某些情况下,不同θ值会产生同一个 p(x|θ) p(θ|Dn) 将在 θ 附近产生峰值,这时不管p(x|θ)

否唯一, p(x|Dn)总会收敛到p(x) 。因此不确定性客观存在。

最大似然估计和贝叶斯参数估计的区别:

最大似然估计

贝叶斯参数估计

计算复杂度

微分

多重积分

可理解性

确定易理解

不确定不易理解

先验信息的信任程度

不准确

准确

例如 p(x|q)

与初始假设一致

与初始假设不一致

 

 

 

 

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/166028.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

苹果企业签名失败常见的问题

苹果企业签名失败的常见问题主要有以下几种: 证书过期或无效:苹果开发者需要定期更新他们的签名证书,以确保其有效性。一旦证书过期,相关应用将无法正常工作。证书不匹配:如果使用的证书与应用程序的Bundle ID不匹配&…

WT588F02B-8S语音芯片支持PWM音频输出的特征优势及应用前景

随着科技的飞速发展,语音芯片作为人机交互的核心组件,在各个领域的应用越来越广泛。而在这些语音芯片中,支持PWM音频输出的特性日益受到关注。本文将探讨语音芯片支持PWM音频输出的特征优势以及其在各个领域的应用前景。 一、特征优势 1、高…

git本地账户如何从一台电脑迁移到另外一台

为了表述方便,我们此处用旧电脑、新电脑指代。 在新电脑上安装git 例如,我旧电脑上安装的git版本是2.33.1版本,新电脑安装git的版本是2.43.0,这不妨碍迁移。 将git的全局配置文件从旧电脑拷贝到新电脑 Git的全局配置文件&…

“关爱零距离.情暖老人心”主题活动

为提高社区老年人的生活质量,促进邻里间的互动与友谊,以及弘扬尊老爱幼的社区精神,11月21日山东省潍坊市金阳公益服务中心、重庆市潼南区同悦社会工作服务中心在潼南区桂林街道东风社区共同在潼南区桂林街道东风社区举办了“关爱零距离.情暖老…

22款奔驰S400L升级原厂360全景影像 高清环绕 无死角

360全景影像影像系统提升行车时的便利,不管是新手或是老司机都将是一个不错的配置,无论是在倒车,挪车以及拐弯转角的时候都能及时关注车辆所处的环境状况,避免盲区事故发生,提升行车出入安全性。 360全景影像包含&…

自学编程,用好这几个网站就够了!

如果你要自学编程,一定要收藏好这7个网站,上面免费的优质教程很多,完全可以省去你上万块钱的学费! 话不多说,直接上干货! 第一个,W3school 一个主打图文教程的网站,不管是前端开发…

怎样将带表格的图片批量合并转换成word表格?

注:本功能适用于V3.66以上版本的金鸣表格文字识别大师 在日常的办公场景中,我们常常会遇到需要将带有表格类的图片识别成excel的需求。我们知道,普通的OCR软件并不具备识别中文表格的功能,即使有,效果也强差人意&…

JSP:MVC

Web应用 一个好的Web应用: 功能完善 易于实现和维护 易于扩展等 的体系结构 一个Web应用通常分为两个部分: m 1. 由界面设计人员完成的 表示层 (主要做网页界面设计) m 2. 由程序设计人员实现的 行为层 (主要完成本…

SELinux零知识学习二十五、SELinux策略语言之类型强制(10)

接前一篇文章:SELinux零知识学习二十四、SELinux策略语言之类型强制(9) 二、SELinux策略语言之类型强制 3. 访问向量规则 AV规则就是按照对客体类别的访问许可指定具体含义的规则,SELinux策略语言目前支持四类AV规则: allow:表示允许主体对客体执行允许的操作。neveral…

2015年7月8日 Go生态洞察:Go、开源与社区

🌷🍁 博主猫头虎(🐅🐾)带您 Go to New World✨🍁 🦄 博客首页——🐅🐾猫头虎的博客🎐 🐳 《面试题大全专栏》 🦕 文章图文…

C#面试题3

1.请解释一下C#中的并发编程和线程安全性。 并发编程是指在多线程环境下编写代码以实现并发执行的能力。C#提供了一些机制来支持并发编程,如线程、任务和并行循环等。线程安全性是指在多线程环境下,代码能够正确地处理共享数据并保持一致性。线程安全的代…

基于springboot实现大学生就业服务平台系统项目【项目源码】计算机毕业设计

基于springboot实现大学生就业服务平台系统演示 Java技术 Java是由SUN公司推出,该公司于2010年被oracle公司收购。Java本是印度尼西亚的一个叫做爪洼岛的英文名称,也因此得来java是一杯正冒着热气咖啡的标识。Java语言在移动互联网的大背景下具备了显著…

企业必看的大数据安全极速传输解决方案

在这个大数据时代,企业在享受大数据带来的便利同时,也面临着巨大的挑战,其中最主要的问题就是数据安全方面和传输方面,为了更好地满足企业大数据传输的需求,小编将深入分析企业对于大数据传输面临的挑战和风险以及大数…

【elementui】el-popover在列表里循环使用,取消的doClose无效解决办法

目录 一、需求效果二、代码详情html方法接口 一、需求效果 在使用elementui的Popover 弹出框时&#xff0c;需求是在table列表里使用&#xff0c;循环出来&#xff0c;无法取消。 二、代码详情 html <el-table-column v-if"checkPermission([admin,user:resetPass…

【C++】标准模板库STL作业(其二)

&#x1f383;个人专栏&#xff1a; &#x1f42c; 算法设计与分析&#xff1a;算法设计与分析_IT闫的博客-CSDN博客 &#x1f433;Java基础&#xff1a;Java基础_IT闫的博客-CSDN博客 &#x1f40b;c语言&#xff1a;c语言_IT闫的博客-CSDN博客 &#x1f41f;MySQL&#xff1a…

C 语言文件读写

C 语言文件读写 在本教程中&#xff0c;您将学习如何在C语言中处理文件。您将通过示例学习在C语言中使用fprintf()、fscanf()、fread()、fwrite()、fseek()等处理标准I/O。 文件是计算机存储设备中用于存储数据的容器。 为什么需要文件&#xff1f; 当程序终止时&#xff0…

vue2,vue3使用vuex

vuex vue的状态管理器 1引入vuex npm install vuex2.创建store/index.js文件 在main.js引入 import { createStore } from vuexconst store createStore({state: () > ({})}) export default store3.state 核心, 用于定义数据 state: () > ({count: 0,name: 陆青,age:…

Py之wikipedia-api:wikipedia-api的简介、安装、使用方法之详细攻略

Py之wikipedia-api&#xff1a;wikipedia-api的简介、安装、使用方法之详细攻略 目录 wikipedia-api的简介 wikipedia-api的安装 wikipedia-api的使用方法 1、 创建 Wikipedia并进行查询 wikipedia-api的简介 Wikipedia-API是一个易于使用的Python封装&#xff0c;用于访…

计算机是如何执行指令的

计算机组成 现在所说的计算机基本上都是冯诺依曼体系的计算机。其核心原理&#xff1a; 冯诺依曼计算的核心思想是将程序指令和数据以二进制形式存储存储在同一存储器中&#xff0c;并使用相同的数据格式和处理方式来处理它们。这种存储程序的设计理念使得计算机能够以可编程…

如何从 C# 制作报表到 FastReport Cloud

众所周知&#xff0c;我们的世界在不断发展&#xff0c;新技术几乎每天都会出现。如今&#xff0c;不再需要在办公室内建立整个基础设施、雇用人员来监控设备、处理该设备出现的问题和其他困难。 如今&#xff0c;越来越多的服务提供业务云解决方案&#xff0c;例如FastReport…