微网站功能列表彩票网站开发的

web/2025/10/5 19:32:51/文章来源:
微网站功能列表,彩票网站开发的,动漫制作公司排名,建设免费网站模板继续是机器学习课程的笔记#xff0c;这节课会介绍逻辑回归。 分类问题 这节课会介绍的是分类问题#xff0c;其结果是离散值。分类问题的例子有判断电子邮件是否是垃圾邮件#xff1b;判断肿瘤是良性还是恶性#xff1b;判断一次金融交易是否是欺诈等等。 首先从二元的…继续是机器学习课程的笔记这节课会介绍逻辑回归。 分类问题 这节课会介绍的是分类问题其结果是离散值。分类问题的例子有判断电子邮件是否是垃圾邮件判断肿瘤是良性还是恶性判断一次金融交易是否是欺诈等等。 首先从二元的分类问题说起我们将因变量可能属于的两个类分别称为负类(Negative Class)和正类(Positive Class)则因变量 y∈{0,1} y \in \{0,1\} 其中0表示负类而1表示正类。分类问题建模 回到初始的乳腺癌分类问题我们可以用线性回归的方法求出适合数据的一条直线如下图所示 根据线性回归模型我们只能预测连续值但对于分类问题我们需要输出的是0或1我们可以如此预测 当hθ≥0.5h_\theta \ge 0.5,预测y1y=1当hθ0.5h_\theta \lt 0.5,预测y0y=0 那么通过这样的预测上图所示的数据是可以根据一个线性模型就能很好地完成分类任务的。 但是此时假设增加了一个非常大尺寸的恶性肿瘤将其作为实例加入到训练集中这使得我们获得一条新的直线如下图所示 这个时候使用阈值为0.5来预测是否是恶性肿瘤就不合适了因为会将原来预测为恶性肿瘤的数据预测为良性肿瘤了。可以看出线性回归模型因为其预测的值可以超越[0,1][0,1]的范围并不适合解决这样的问题。 所以我们就引入一个新的模型–逻辑回归(Logistic Regression)0≤htheta(x)≤10 \le h_theta(x) \le 1,即其输出变量范围始终在[0,1]。 逻辑回归简介 逻辑回归模型的假设是 hθ(x)g(θTX) h_\theta(x) = g(\theta^T X)其中 * XX代表特征向量 * gg代表逻辑函数(logistic function),是一个常用的 S形函数(Sigmoid function),其公式为g(z)11e−zg(z) = \frac{1}{1+e^{-z}},其图像如下所示 所以我们可以得到逻辑回归模型的假设是 hθ(x)11e−θTXh_\theta(x) = \frac{1}{1+e^{-\theta^TX}}对于这个模型可以理解为hθ(x)h_\theta(x)就是对于给定的输入变量xx,根据选择的参数计算输出变量y=1y=1的可能性也就是概率值即hθ(x)P(y1|x;θ)h_\theta(x) = P(y=1 |x;\theta) 举个例子如果对于给定的x通过已经确定的参数计算得到hθ(x)0.7h_\theta(x) = 0.7,则表示有70%的几率可以判定yy是正类,相应地yy是负类的几率是30%。 决策边界 在之前的逻辑回归中我们是如此预测的 当hθ≥0.5h_\theta \ge 0.5,预测y1y=1当hθ0.5h_\theta \lt 0.5,预测y0y=0 根据上面的S形函数图象我们可以知道 z0z=0时g(z)0.5g(z) = 0.5z0z \gt 0时g(z)0.5g(z) \gt 0.5z0z \lt 0时g(z)0.5g(z) \lt 0.5 又因为zθTXz=\theta^T X,则有 θT≥0\theta^T \ge 0,预测y1y=1θT0\theta^T \lt 0,预测y0y=0 线性边界 现在假设有一个模型hθ(x)g(θ0θ1x1θ2x2)h_\theta(x) = g(\theta_0+\theta_1 x_1+\theta_2 x_2),且参数θ⎡⎣⎢−311⎤⎦⎥\theta =\left[\begin{matrix}-3 \\ 1 \\ 1 \end{matrix}\right] 那么当−3x1x2≥0-3+x_1+x_2 \ge 0时可以预测y1y=1,所以我们可以绘制直线x1x23x_1+x_2=3,这条线便是我们模型的分界线将预测为1和预测为0的区域分隔开如下图所示。 非线性边界 上述例子中的决策边界是一个线性边界但是并非所有数据都可以通过逻辑回归模型得到一个线性边界的是存在有非线性边界的如下图所示 看得出来这个例子中需要使用一个曲线所以需要二次方特征 hθ(x)g(θ0θ1x1θ2x2θ3x21θ4x22)h_\theta(x) = g(\theta_0+\theta_1 x_1+\theta_2 x_2+\theta_3 x_1^2+\theta_4 x_2^2)假设参数是θ⎡⎣⎢⎢⎢⎢⎢⎢−10011⎤⎦⎥⎥⎥⎥⎥⎥\theta = \left[\begin{matrix}-1 \\ 0 \\ 0 \\ 1 \\ 1 \end{matrix}\right],这样我们得到的决策边界恰好是一个圆心在原点半径是1的圆形。 除了上述例子还可以有更复杂的模型来适合非常复杂形状的决策边界比如使用到三次方特征等。 代价函数 在线性回归模型中我们定义的代价函数是所有建模误差的平方和函数。也就是J(θ)12m∑mi1(hθ(x(i))−y(i))2J(\theta) = \frac{1}{2m} \sum_{i=1}^m (h_\theta(x^{(i)})-y^{(i)})^2。 在逻辑回归模型中可以沿用这个定义并且我们假设Cost(hθ(x(i)),y(i))12(hθ(x(i))−y(i))2Cost(h_\theta(x^{(i)}),y^{(i)}) = \frac{1}{2}(h_\theta(x^{(i)})-y^{(i)})^2但是这里就会产生一个问题我们得到的代价函数将是一个非凸函数(non−convex function)\color{red}{非凸函数(non-convex \ function)}。非凸函数和凸函数的图像如下所示 这意味着代价函数将有许多局部最小值会影响梯度下降算法寻找全局最小值。 因此我们重新定义逻辑回归的代价函数为J(θ)1m∑mi1Cost(hθ(x(i)),y(i))J(\theta) = \frac{1}{m} \sum_{i=1}^m Cost(h_\theta(x^{(i)}),y^{(i)})其中 Cost(hθ(x(i)),y(i)){−log(hθ(x))if y1−log(1−hθ(x))if y0Cost(h_\theta(x^{(i)}),y^{(i)}) = \begin{cases} -log(h_\theta(x)) \quad \text{if y=1} \\ -log(1-h_\theta(x)) \quad \text{if y=0} \end{cases}也就是hθ(x)h_\theta(x)与Cost(hθ(x),y)Cost(h_\theta(x),y)的关系如下图所示 这样构建的Cost(hθ(x),y)Cost(h_\theta(x),y)函数的特点是 当实际的y1y=1且hθ1h_\theta=1时误差为0但如果hθ≠1h_\theta \neq 1时误差会随着hθh_\theta的变小而变大 当实际的y0y=0且hθ0h_\theta=0时误差为0但如果hθ≠0h_\theta \neq 0时误差会随着hθh_\theta的变大而变大 简化代价函数 接下来是简化代价函数将代价函数用一行来表示由于yy总是0或1中的一个值,所以,我们可以简化代价函数成如下所示: Cost(hθ(x),y)=−y∗log(hθ(x))−(1−y)∗log(1−hθ(x)) Cost(h_\theta(x),y) = -y*log(h_\theta(x))-(1-y)*log(1-h_\theta(x))那么代价函数是 J(θ)1m[∑i1my(i)loghθ(x(i))(1−y(i)log(1−hθ(x(i)))]J(\theta) = \frac{1}{m} [\sum_{i=1}^my^{(i)}logh_\theta(x^{(i)})+(1-y^{(i)}log(1-h_\theta(x^{(i)}))]梯度下降法 得到上述简化后的代价函数后我们就可以使用梯度下降算法来求得能使得代价函数最小的参数了。 算法如下所示 Repeat θj : θj−α∂∂θjJ(θ) \theta_j \ := \ \theta_j-\alpha \frac{\partial}{\partial \theta_j} J(\theta)同时更新所有的参数θ\theta 求导后得到 Repeat θj : θj−α∑i1m(hθ(x(i))−y(i))x(i)j \theta_j \ := \ \theta_j-\alpha \sum_{i=1}^m (h_\theta(x^{(i)})-y^{(i)})x_j^{(i)}同时更新所有的参数θ\theta 注意这里虽然得到的梯度下降算法的公式表面上和线性回归得到的梯度下降算法一样但是两者的模型hθ(x)h_\theta(x)是不一样的线性回归的是hθ(x)θTxh_\theta(x) = \theta^Tx而逻辑回归的是hθ(x)11e−θTxh_\theta(x)=\frac{1}{1+e^{-\theta^Tx}}因此两者是不一样的同时在运行梯度下降算法之前进行进行特征缩放依旧是必要的。 高级优化方法 目前介绍的让代价函数最小的算法是有使用梯度下降算法以及正规方程方法但除此之外还有其他算法它们更加复杂和优越而且通常不需要人工选择学习率通常比梯度下降算法要更加快速。 这些算法有共轭梯度(Conjugate gradient)局部优化法(Broyden fletcher goldfarb shann,BFGS),有限局部优化法(L-BFGS)。 但是这些算法的最大缺点也就是非常复杂了所以一般是建议直接使用现有的第三方库中实现好的函数来直接运行这些算法而不是自己写代码来实现。 多类分类 在多类分类问题中我们的训练集有多个类此时就无法仅仅用一个二元变量(0或1)来做判断依据。例如我们要预测天气情况分四种类型晴天、多云、下雨或下雪。 下面是一个多类分类问题可能的情况 一种解决这类问题的方法是采用一对多(One-vs-All)方法。在一对多方法中我们可以将多类分类问题转换成二元分类问题。 为了能实现这样的转变我们将多个类中的一个类标记为正类(y1y=1)然后将其他所有类标记为负类这个模型记作h(1)θxh_\theta^{(1)}x。接着我们可以同样选择另一个类标记为正类(y2y=2),再将其他类标记为负类这个模型记作h(2)θxh_\theta^{(2)}x,依次类推也就是可以如下图所示。 最后我们得到一系列的模型简记为h(i)θp(yi |x;θ)其中i(1,2,3,…,k)h_\theta^{(i)}=p(y=i\ |x;\theta)\quad 其中i=(1,2,3,\ldots,k),也就是对于kk个类的分类问题,使用一对多方法,会得到kk个分类器。 然后在预测的时候对于输入变量xx,我们会将所有的分类器都运行一遍,然后选择一个类别ii使得maxih(i)θ(x)max_i h_\theta^{(i)}(x)也就是选择输出最大可能性的分类器所代表的类别。 小结 本节内容是介绍逻辑回归问题对应的就是监督学习中的分类问题。这里之所以有回归二字是因为其使用的模型形式是类似于线性回归的。当然这里介绍的模型函数是一个S形函数用来解决一个二元分类问题。 接下来就是介绍代价函数由于直接套用线性回归的代价函数会得到一个非凸函数不利于使用梯度下降法来寻找局部最小值所以这里是使用了一个新的代价函数来达到同样的效果因此也就顺利得到需要的代价函数以及梯度下降算法的公式。 最后就介绍了除了梯度下降法之外的一些优化方法但是这些方法会比梯度下降法要复杂得多。然后还有就是对于多类分类问题可以使用一对多的方法来转换成二元分类问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/87525.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

哈尔滨大型网站建设电话策划运营

ThreeJS的动画系列分为:基础动画、相机控制、变形动画、用骨骼和蒙皮制作动画以及使用外部模型创建动画。用骨骼和蒙皮制作动画用骨骼来做动画时,移动一下骨骼,Three.js必须决定如何相应地迁移附着在骨骼上的皮肤,一起来看吧~~~举…

小程序推广模式和营销方案成都seo论坛

重置MYSQL密码后,Navicat连接报错:2003 - Can‘t connect to MySQL server on ‘127.0.0.1‘ (61 “Connection refused“) 报错如下 解决方法:勾选使用套接字文件

做视频网站需要什么服务器网站建设的编程语言

产品描述 本系列产品,是在该公司研制的专用超大规模集成电路的基础上,研发的点对点多业务光传输设备。此款产品提供4路视频,1-4路电话接口;1-16路开关量接口/1-8路RS232-422-485接口;4路千兆以太网接口(共享…

网站建设管理情况报告seo外链怎么做能看到效果

基于Pix4D使用无人机光学影像制作正射影像(DOM)和数字表面模型(DSM) 操作步骤 0. 前言1.获取无人机光学影像2.DOM和DSM3.操作步骤3.1 初始界面3.2 新建项目3.3查看处理过程报告3.4查看处理进度和成果 4.在ArcMap中打开DSM和DOM 0.…

哪个网站旅游攻略做的最好建设银行广西分行招聘网站

数据库的概念 数据库是按照数据结 构来组织、存储和管理数据的系统,它允许用户高效地存储、检索、更新和管理数据 database:用来组织,存储,管理数据的仓库 数据库的管理系统:DBMS,实现对数据的有效储值&am…

专业电商网站建设多少钱做网站注意事项

💕💕作者:计算机源码社 💕💕个人简介:本人七年开发经验,擅长Java、Python、PHP、.NET、微信小程序、爬虫、大数据等,大家有这一块的问题可以一起交流! 💕&…

网站被墙301怎么做网站建设过程中的网站设计怎么做

今天跟大家分享一下,作为新手怎么样写出一篇阅读量过万的公众号的文章。 我的公众号是从2020年开始写的,写到今天差不多三年多一点。然后现在的粉丝数虽然不多,但也差不多近两千个了。 我这三年多差不多更新了150篇原创文章。刚开始的时候写的…

云主机建网站维纳斯式束腰Wordpress

ContentProvider ContentProvider 是 Android 中用于实现数据共享的一种组件,它可以让不同的应用程序之间共享数据。数据通常以表格的形式组织,类似于数据库的表。其他应用程序可以通过 ContentResolver 来查询或修改这些数据。 ContentProvider、Conten…

都安网站建设苏州人才网

实验十二 图查找 一、实验目的与要求 1)掌握拓扑排序的应用; 2)掌握查找的概念和算法; 3)掌握查找的基本原理以及各种算法的实现; 4)掌握查找的应用。 二、实验内容 1. 用邻接表建立一…

广德做网站设计开发苏州高新区核酸检测

背景CVPR 2019 是机器视觉方向最重要的学术会议,本届大会共吸引了来自全世界各地共计 5160 篇论文,共接收 1294 篇论文,投稿数量和接受数量都创下了历史新高,其中与自动驾驶相关的论文、项目和展商也是扎堆亮相,成为本…

常州优化网站手机网站平台

🚀 本文选自专栏:人工智能领域200例教程专栏 从基础到实践,深入学习。无论你是初学者还是经验丰富的老手,对于本专栏案例和项目实践都有参考学习意义。 ✨✨✨ 每一个案例都附带有在本地跑过的核心代码,详细讲解供大家学习,希望可以帮到大家。欢迎订阅支持,正在不断更新…

做汽车保养的网站上wordpress用什么开发工具

一、第一个代码案例1.1. HelloWorld案例1.1.1 代码执行流程我们写的代码都将以.java开头的文件保存,经过类编译器编译成.class的字节码文件,然后通过解释器翻译与机器交流1.1.1 代码执行流程1. 编写代码步骤首先定义一个类:public class 类名…

企业门户网站静态模板办公室装修注意事项

此为牛客Linux C课程和黑马Linux系统编程笔记。 1. 网络字节序 我们已经知道,内存中的多字节数据相对于内存地址有大端和小端之分。 磁盘文件中的多字节数据相对于文件中的偏移地址也有大端小端之分。网络数据流同样有大端小端之分,那么如何定义网络数…

网站需求怎么写网站接入商查询

QT(19)-QCamera 1 公有类型1.1 帧速率1.2 捕获模式1.3 错误类型1.4 摄像头锁定状态改变的原因1.5 摄像头锁定的整体状态1.6 摄像头可以应用锁定的类型1.7 QCamera::Position1.8 QCamera::State1.9 QCamera::Status 2 公有函数2.1 构造函数:2.2 析构函数:2.3 成员函数…

中山建网站哪家好仿站怎么修改成自己的网站

本文章来给各位同学介绍css怎样让英文字母数字自动换行且不断词方法总结,有需要了解的同学可进入参考。当一个定义了宽度的块状元素中填充的全部为纯英文或者纯数字的时候,在IE和FF中都会撑大容器,不会自动换行并且当数字或者英文中带有汉字时…

深圳宝安西乡网站建设免费企业黄页下载

目录 数据结构实验十 树遍历应用一、【实验目的】二、【实验内容】三、【实验源代码】⭐ CPP版⭐ c语言版 四、实验结果 数据结构实验十 树遍历应用 一、【实验目的】 1、了解树的建立方法 2、掌握树与二叉树的转化及其遍历的基本方法 3、掌握递归二叉树遍历算法的应用 二、…

网络科技网站排名互联网舆情处置公司

2024年7月15日,JumpServer开源堡垒机正式发布v4.0版本。在JumpServer开源堡垒机v4.0版本的设计过程中,JumpServer开源项目组继续秉持“内外兼修”的原则,并且开始迈步走向全球化,同时进一步提升用户的使用体验,真正用心…

多个域名绑定同一网站德州网站制作

2024年6月7日,深圳中赢娱乐控股集团受邀来到江西省宜春市袁州区就“短剧文旅”项目展开深度座谈,并与飞剑潭乡达成合作意向。 下午2:30,深圳中赢控股集团董事李平进带团队一行12人,访问宜春市袁州区,宜春市副市长谢萍、…

泰安网站建设公司网盘网页版

重点看一下:逻辑与,出现多层if嵌套的情况 实际开发中,与门应该是最容易也是最应该被优化的。 合并后的条件代码会表述“实际上只有一次条件检查,只不过有多个并列条件需要检查,从而使这一次检查的用意更清晰。当然&am…

惠州网站建设方案托管百度竞价广告的位置

欢迎进入Oracle社区论坛,与200万技术人员互动交流 >>进入 Oracle中表的外键是保证系统参照完整性的手段,而参照完整性是指分布在两个表中的列所满足的具有主从性质的约束关系。外键涉及到两个表,其中一个称之为父项表,另一个…