08. 支持向量机

一、支持向量机

  支持向量机(Support Vector Machines,SVM)是一种二分类模型,其核心目标是寻找一个间隔最大的超平面将不同类别的数据点分隔开。这个超平面在二维空间中是一条直线,在三维空间中是一个平面,在更高维空间则是一个超平面。

支持向量机

二、线性可分支持向量机

【1】、硬间隔

  当训练样本线性可分时,此时可以通过最大化硬间隔来学习线性可分支持向量机。硬间隔是指超平面能够将不同类的样本完全划分开。距离超平面最近的几个样本点称为 支持向量,它们直接决定超平面的位置和方向,只要支持向量不变,超平面就不会变。

线性可分支持向量机

  在样本空间中,超平面可表示为:

\[\vec{w}^{T}\vec{x} + b = 0 \]

  其中 \(\vec{w} = (w_{1}, w_{2}, ..., w_{n}\)法向量,决定了 超平面的方向,b 为 位移项,决定了 超平面与原点之间的距离。将超平面记为 \((w, b)\)。相应的分类函数称为 线性可分支持向量机

\[f(x) = sign(\vec{w}{^{T}}\vec{x} + b) \]

【2】、间隔与最大间隔

  \(x'\) 为超平面上一点,\(w_{T}x' + b = 0\),样本空间中任一点 x 到超平面 (w, b) 的距离为:

\[f = \abs{\frac{\vec{w}^{T}}{\lvert\lvert \vec{w} \rvert\rvert}(\vec{x} - \vec{x}')} = \frac{\vec{w}^{T}\vec{x} + b}{\lvert\lvert \vec{w} \rvert\rvert} \]

线性可分支持向量机的间隔

  记每个样本点 \(\vec{x}_{i}\) 的类别为 \(y_{i}\) ,该样本点的函数间隔 \(\widehat{Y_{i}} = y_{i}(\vec{w}^{T}\vec{x} + b)\),表示分类预测的正确性及确信度,若超平面 (w, b) 能够将样本正确分类,则有:

\[y = \begin{cases} \vec{w}^{T}\vec{x}_{i} + b > 0, & y_{i} = +1 \\ \vec{w}^{T}\vec{x}_{i} + b < 0, & y_{i} = -1 \end{cases} \]

  此时有

\[y_{i}(\vec{w}^{T}\vec{x} + b) = \abs{w^{T}\vec{x}_{i} + b} > 0 \\ r_{i} = \frac{\vec{w}^{T}\vec{x}_{i} + b}{\lvert\lvert \vec{w} \rvert\rvert} = \frac{y_{i}(\vec{w}^{T}\vec{x}_{i} + b)}{\vert\lvert w \rvert\rvert} = \frac{\widehat{y_{i}}}{\lvert\vert \vec{w} \rvert\rvert} \]

  观察上述公式,我们可以看出对 \(\vec{w}\), b 进行缩放 \(\vec{w} \rightarrow \lambda\vec{w}\)\(b \rightarrow \lambda b\)时,不会改变超平面,也不会改变 r 的值,但函数间隔 \(\widehat{Y}_{i} = y_{i}(\vec{w}^{T}\vec{x_{i}} + b)\) 会随着缩放 \(\vec{w}\) 和 b 而发生改变,也就是说通过缩放 \(\vec{w}\) 和 b 来任意缩放函数间隔 \(\widehat{y}_{i}\) 而不改变 \(r_{i}\)。因此,令支持向量 \(\widehat{Y_{i}} = 1\),此时支持向量到超平面的距离 \(r_{i}= \frac{\widehat{Y_{i}}}{\lvert\lvert w \rvert\rvert} = \frac{1}{\lvert\lvert w\rvert\rvert}\)。两个异类支持向量到超平面的距离之和 \(\gamma = \frac{2}{\lvert\lvert w \rvert\rvert}\)\(\gamma\) 被称为 间隔。欲找到最大间隔的超平面,也就是在约束 \(y_{i}(\vec{w}^{T}\vec{x}_{i} + b) \ge 1\) 下找到最大 \(\gamma\)

三、线性支持向量机

  先前我们假定样本在样本空间中线性可分,但现实中很可能并非如此,此时,我们无法找出一个合适的超平面将所有样本点完全正确划分。通常训练数据中会有一些特异点,如果将这些特异点去掉,剩下大部分样本点是线性可分的。这时,我们可以放宽条件,允许某些样本分错,为此,我们引入软间隔。

线性支持向量机

  线性不可分意味着某些样本点 \((x_{i}, y_{i})\) 不能满足约束条件 \(y_{i}(\vec{w}^{T}\vec{x}_{i} + b) \ge 1\)。为解决这个问题,可以对每个样本点引入一个松弛变量 \(\xi \ge 0\),使得函数间加上松弛变量 \(\ge\) 1。这时约束条件变为:

\[y_{i}(\vec{w}^{T}\vec{x}_{i}) \ge 1 - \xi_{i} \]

  同时,为了在最大化间隔的时候使不满足约束的样本尽可能少,目标函数中引入对误分类的惩罚:

\[\frac{{\lvert\lvert w \rvert\rvert}^{2}}{2} + C \sum_{i=1}^{n}\xi_{i} \]

  这里 \(C > 0\)惩罚系数,C 值越大对误分类的惩罚越大。

四、非线性支持向量

  非线性分类问题是指通过利用非线性模型才能很好地进行分类,我们无法直接使用超平面对齐进行分类。这时,我们可以通过核函数将数据从原始空间映射到高维特征空间,使得数据在高维特征空间可分,将原本地的非线性问题转换为线性问题。使用核技学习非线性向量机等价于隐式地在高维特征空间中学习线性支持向量机。

非线性支持向量机

  核函数地选择也是支持向量机最大的变数,若核函数选择不合适,意味着样本映射到了一个不合适的特征空间,很可能导致性能不佳。下面是几种常用的核函数。

  • 线性核\(k(\vec{x_{i}}, \vec{x_{j}}) = \vec{x_{i}}^{T}\vec{x_{j}}\)
  • 多项式核\(k(\vec{x_{i}}, \vec{x_{j}}) = (\vec{x_{i}}^{T}\vec{x_{j}})^{d}\)
  • 高斯核\(k(\vec{x_{i}}, \vec{x_{j}}) = \exp(-\frac{\lvert\lvert\vec{x_{i}} - \vec{x_{j}}\rvert\vert^{2}}{2\sigma^{2}})\)
  • 拉普拉斯核\(k(\vec{x_{i}}, \vec{x_{j}}) = \exp(-\frac{\lvert\lvert\vec{x_{i}} - \vec{x_{j}}\rvert\rvert}{\sigma})\)
  • Sigmoid 核\(k(\vec{x_{i}}, \vec{x_{j}}) = \tanh(\beta\vec{x_{i}}^{T}\vec{x_{j}} + \theta)\)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1174908.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2026年8款降AI率工具实测推荐,毕业生必看

2026年8款降AI率工具实测推荐&#xff0c;毕业生必看 TL;DR&#xff1a;2026年知网AIGC检测升级后&#xff0c;传统同义词替换已失效。实测8款降AI工具后&#xff0c;推荐嘎嘎降AI&#xff08;性价比高、达标率99.26%&#xff09;和比话降AI&#xff08;知网专精、AI率可降至0%…

深度学习毕设项目:基于python-pytorch机器学习训练混凝土是否含有裂缝识别

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

java-SSM300全国消费水平展示平台-springboot

目录项目背景技术架构核心功能创新亮点应用价值开发技术源码文档获取/同行可拿货,招校园代理 &#xff1a;文章底部获取博主联系方式&#xff01;项目背景 Java-SSM300全国消费水平展示平台基于SpringBoot框架开发&#xff0c;旨在通过数据可视化技术动态展示全国各地区消费水…

深度学习毕设项目:基于python-pytorch机器学习训练会飞的昆虫识别

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

手把手教你用嘎嘎降AI处理论文,5分钟搞定

手把手教你用嘎嘎降AI处理论文&#xff0c;5分钟搞定 TL;DR&#xff1a;嘎嘎降AI操作非常简单&#xff0c;打开网站→上传论文→等待处理→下载结果&#xff0c;5分钟就能搞定。价格4.8元/千字&#xff0c;有1000字免费试用。本文详细讲解每一步操作。 为什么选嘎嘎降AI 在众多…

【毕业设计】基于python-pytorch深度学习训练混凝土是否含有裂缝识别

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

计算机深度学习毕设实战-基于机器学习python-pytorch训练会飞的昆虫识别

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

Thread.sleep() 方法详解

一、 方法本质与设计目的Thread.sleep() 是一个静态方法&#xff0c;其核心目的是让当前正在执行的线程主动暂停执行一段指定的时间。这是一种使线程进入“非活动”或“等待”状态的直接方式&#xff0c;是 Java 并发编程中用于控制线程执行时序的基本工具之一。其设计源于操作…

领航技术股份-燃气报警器哪个品牌好

领航技术股份-选择燃气报警器时&#xff0c;需要考虑品牌的专业性、产品性能、市场口碑等因素。以下是一些值得推荐的品牌&#xff1a;费加罗&#xff08;FIGARO&#xff09;&#xff1a;1968 年始于日本&#xff0c;是国内较大的气敏报警产品生产商。其专注于气体传感器、可燃…

【毕业设计】基于python-pytorch深度学习训练会飞的昆虫识别

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

提示工程架构师必学:数据依赖性分析的因果推断技巧

提示工程架构师必学&#xff1a;用因果推断破解数据依赖性分析难题 一、引言&#xff1a;为什么提示工程需要因果推断&#xff1f; 作为提示工程架构师&#xff0c;你是否遇到过这样的困惑&#xff1f; 明明优化了提示话术&#xff08;比如加入“请用口语化表达”&#xff09;&…

领航技术股份-燃气泄漏报警器

领航技术股份-燃气泄漏报警器是通过气体传感器监测燃气浓度&#xff0c;超标时触发声光报警并可联动切断气源的安全装置&#xff0c;核心用于防范天然气、液化气等泄漏引发的爆炸与中毒&#xff0c;是家庭及商用场所的必备安防设备深圳住建局。以下从核心要点、选型、安装维护、…

【课程设计/毕业设计】基于深度学习python-pytorch训练会飞的昆虫识别

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

Linux | i.MX6ULL C 程序调用 shell

01 本章节介绍的是在 linux 系统环境下 linux-C 调用 shell 命令控制 GPIO 输入输出步骤。shell 作为 Linux操作系统的外壳,为用户提供使用操作系统的接口。它是命令语言、命令解释程序及程序设计语言的统称,它解释由用户输入的命令并且把它们送到内核。 使用 shell 命令…

硬件感知量化:面向特定芯片的模型优化

硬件感知量化:面向特定芯片的模型优化 关键词:硬件感知量化、特定芯片、模型优化、深度学习、量化算法 摘要:本文围绕硬件感知量化这一面向特定芯片的模型优化技术展开。首先介绍了该技术的背景,包括目的、适用读者、文档结构和相关术语。接着阐述了核心概念及联系,通过文本…

深度学习毕设选题推荐:基于python-pytorch卷神经网络训练混凝土是否含有裂缝识别

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

深度学习毕设选题推荐:基于python-pytorch卷神经网络训练混凝土是否含有裂缝识别

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

深度测评专科生必备!8款一键生成论文工具TOP8测评

深度测评专科生必备&#xff01;8款一键生成论文工具TOP8测评 2026年专科生论文写作工具测评&#xff1a;为何需要一份权威榜单&#xff1f; 随着高校教育的不断深化&#xff0c;专科生在学术写作方面的需求日益增长。然而&#xff0c;面对繁重的课程任务和论文撰写压力&#x…

直接用一个公式,就逼近几千神经元的效果,吊打传统aI,你们赶紧拿去当知识蒸馏和混合生成,让传统AI的实力进一步提高

<!DOCTYPE html><html lang"zh-CN"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width,initial-scale1.0"><title>意义密度多问题混合问答</title><style>…

告别命令行“黑箱“!Open Claude Cowork:让AI代理可视化协作的革命性桌面应用

&#x1f525; 博主正在参加2025博客之星活动&#xff0c;您的每一票都是对技术分享的最大鼓励&#xff01; &#x1f449; 点击为博主投票https://www.csdn.net/blogstar2025/detail/070 感谢您的支持&#xff01;让我们一起推动技术社区的发展&#xff01; 引言&#xff1a;当…