【课堂笔记】核方法和Mercer定理

文章目录

  • Kernal
    • 引入
    • 定义
    • Mercer定理
      • 描述
      • 有限情形证明
      • 一般情形证明

Kernal

引入

  在实际数据中常常遇到不可线性分割的情况,此时通常需要将其映射到高维空间中,使其变得线性可分。例如二维数据:
在这里插入图片描述

通过映射 ϕ ( x 1 , x 2 ) = ( x 1 2 , 2 x 1 x 2 , x 2 2 ) \phi(x_1, x_2) = (x_1^2, \sqrt{2}x_1x_2, x_2^2) ϕ(x1,x2)=(x12,2 x1x2,x22),将数据投影到三维空间,下面展示的是一个二维投影(三维画不出来):
在这里插入图片描述
  于是我们可以找到一个超平面(如 x 1 2 + x 2 2 = c x_1^2 + x_2^2 = c x12+x22=c)来把两类数据分开。这种投影方法被称为显式投影法,即构造出一个函数 ϕ ( x ) \phi(x) ϕ(x)将数据从原始空间投影到高维空间。

  在一些模型中(如SVM),需要计算高维空间下数据点之间的内积 x 1 ⊤ x 2 x_1^\top x_2 x1x2,反映数据点之间的相似度。然而将数据点投影后再计算会产生许多时间花费和空间花费。那有没有什么方法能直接计算出内积,跳过投影的过程呢?~~有的兄弟,有的。~~于是核方法诞生了。

定义

  核方法(Kernel Methods)是一类机器学习算法,旨在通过将数据从原始空间隐式映射到高维特征空间来解决非线性问题,同时利用核函数高效计算特征空间中的内积,而无需显式计算高维特征向量。
  设输入空间为 X \mathcal{X} X,如下形式的函数称为核函数:
K : X × X → R \mathcal{K}: \mathcal{X} \times \mathcal{X} \to \mathbb{R} K:X×XR
满足其对应的Gram矩阵正定的半正定的,这保证了核函数在数学上定义了一个有效的内积空间。
  则这个核函数一定能写成某个高维空间的内积 K ( x , x ′ ) = ϕ ( x ) ⊤ ϕ ( x ′ ) \mathcal{K}(x,x') = \phi(x)^\top\phi(x') K(x,x)=ϕ(x)ϕ(x),这由Mercer定理支持。

Mercer定理

描述

  如果核函数 K : X × X → R \mathcal{K}: \mathcal{X} \times \mathcal{X} \to \mathbb{R} K:X×XR满足Mercer条件,即正定性,则存在一个映射 ϕ : X → H \phi: \mathcal{X} \to \mathcal{H} ϕ:XH,将 x x x映射到某个希尔伯特空间,使得:
K ( x , x ′ ) = ϕ ( x ) T ϕ ( x ′ ) \mathcal{K}(x, x') = \phi(x)^T\phi(x') K(x,x)=ϕ(x)Tϕ(x)

有限情形证明

先在有限数据集 { x 1 , . . . , x N } ⊂ X \set{x_1, ..., x_N} \subset \mathcal{X} {x1,...,xN}X上证明:由于 K \mathcal{K} K是对称正定矩阵,则可以分解为
K = U ⊤ Λ U Λ = diag  ( λ 1 , . . . , λ N ) , λ i ≥ 0 \mathcal{K} = U^\top\Lambda U \\ \Lambda = \text{diag }(\lambda_1, ..., \lambda_N), \lambda_i \ge 0 \\ K=UΛUΛ=diag (λ1,...,λN),λi0
U U U是正交矩阵, U ⊤ U = I U^\top U=I UU=I,列向量 u 1 , . . . , u N u_1, ..., u_N u1,...,uN是特征向量。
定义特征映射为 ϕ : X → R N \phi:\mathcal{X} \to \mathbb{R}^N ϕ:XRN为:
ϕ ( x i ) = Λ 1 / 2 u i \phi(x_i) = \Lambda^{1/2}u_i ϕ(xi)=Λ1/2ui
其中 Λ 1 / 2 = diag  ( λ 1 , . . . , λ N ) \Lambda^{1/2} = \text{diag }\left(\sqrt{\lambda_1}, ..., \sqrt{\lambda_N}\right) Λ1/2=diag (λ1 ,...,λN )
验证内积:
ϕ ( x i ) ⊤ ϕ ( x j ) = u i ⊤ Λ u j = K ( x i , x j ) \phi(x_i)^\top\phi(x_j) = u_i^\top \Lambda u_j = \mathcal{K}(x_i, x_j) ϕ(xi)ϕ(xj)=uiΛuj=K(xi,xj)
补充:若 K \mathcal{K} K的秩 r < N r < N r<N,(可能有零特征值),特征空间的维度可以降为 r r r,即只保留非零特征值对应的分量。
这证明了对于有限数据集,核函数可以通过特征分解构造一个有限维特征空间的内积。

一般情形证明

  为了严谨性,对于一般核函数 K ( x , x ′ ) \mathcal{K}(x, x') K(x,x),输入空间 X \mathcal{X} X可能是连续的(如 X = R d \mathcal{X} = \mathbb{R}^d X=Rd或紧致域),且核函数可能定义在无穷多点上。Mercer定理的完整形式需要函数空间的理论,特别是再生核希尔伯特空间(RKHS)
  假设:
(1) X \mathcal{X} X是紧致集
(2) K ( x , x ′ ) \mathcal{K}(x, x') K(x,x)是对称的、连续的,且满足Mercer条件(正定性)。
(3)正定性在连续情形下定义为:对于任意平方可积函数 f ∈ L 2 ( X ) f \in \mathcal{L}^2(\mathcal{X}) fL2(X),有:
∬ X × X f ( x ) K ( x , x ′ ) f ( x ′ ) d x d x ′ ≥ 0 \iint_{\mathcal{X} \times \mathcal{X}} f(x)\mathcal{K}(x, x')f(x')dxdx' \ge 0 X×Xf(x)K(x,x)f(x)dxdx0
  然后对 K \mathcal{K} K进行特征展开,核函数 K ( x , x ′ ) \mathcal{K}(x, x') K(x,x)作为一个对称正定算子,可以通过特征值分解表示。定义积分算子:
( T K f ) ( x ) = ∫ X K ( x , x ′ ) f ( x ′ ) d x ′ (T_Kf)(x) = \int_\mathcal{X}\mathcal{K}(x, x')f(x')dx' (TKf)(x)=XK(x,x)f(x)dx
T K T_K TK是一个紧致、自我伴随的算子(因为 K \mathcal{K} K对称且连续)。根据希尔伯特-施密特理论, T K T_K TK有可数个特征值 λ i ≥ 0 \lambda_i \ge 0 λi0和对应的特征函数 ψ i ( x ) \psi_i(x) ψi(x),满足:
T K ψ i = λ i ψ i , ∫ X K ( x , x ′ ) ψ i ( x ′ ) d x ′ = λ i ψ i T_K \psi_i = \lambda_i\psi_i, \int_\mathcal{X}\mathcal{K}(x, x')\psi_i(x')dx' = \lambda_i\psi_i TKψi=λiψi,XK(x,x)ψi(x)dx=λiψi
特征函数 { ψ i } \left\{\psi_i\right \} {ψi}构成了 L 2 ( X ) \mathcal{L}^2(\mathcal{X}) L2(X)的正交基,满足:
∫ X ψ i ( x ) ψ j ( x ) d x = δ i j \int_\mathcal{X}\psi_i(x)\psi_j(x)dx = \delta_{ij} Xψi(x)ψj(x)dx=δij
核函数可以表示为特征展开:
K ( x , x ′ ) = ∑ ∞ i = 1 λ i ψ i ( x ) ψ i ( x ′ ) \mathcal{K}(x,x') = \underset{i=1}{\overset{\infty}{\sum}}\lambda_i\psi_i(x)\psi_i(x') K(x,x)=i=1λiψi(x)ψi(x)
这一级数在 X × X \mathcal{X} \times \mathcal{X} X×X上均匀收敛(因为 K \mathcal{K} K连续且 X \mathcal{X} X紧致)

然后我们构造特征映射 ϕ : X → H \phi: \mathcal{X} \to \mathcal{H} ϕ:XH,其中 H \mathcal{H} H是希尔伯特空间(通常是 l 2 l^2 l2,无穷维序列空间),可以理解为无限维的欧几里得空间。
ϕ ( x ) = ( λ 1 ψ 1 ( x ) , λ 1 ψ 2 ( x ) , . . . ) \phi(x) = \left(\sqrt{\lambda_1}\psi_1(x), \sqrt{\lambda_1}\psi_2(x), ... \right) ϕ(x)=(λ1 ψ1(x),λ1 ψ2(x),...)
每个 ϕ ( x ) \phi(x) ϕ(x)是一个无穷序列,其分量为 λ i ψ i ( x ) \sqrt{\lambda_i}\psi_i(x) λi ψi(x)
H \mathcal{H} H中的内积定义为:
ϕ ( x ) ⊤ ϕ ( x ′ ) = ∑ ∞ i = 1 ( λ i ψ i ( x ) ) ( λ i ψ i ( x ′ ) ) = ∑ ∞ i = 1 λ i ψ i ( x ) ψ i ( x ′ ) = K ( x , x ′ ) \phi(x)^\top\phi(x') = \underset{i=1}{\overset{\infty}{\sum}}\left(\sqrt{\lambda_i}\psi_i(x)\right)\left(\sqrt{\lambda_i}\psi_i(x')\right)=\underset{i=1}{\overset{\infty}{\sum}}\lambda_i\psi_i(x)\psi_i(x') = \mathcal{K}(x,x') ϕ(x)ϕ(x)=i=1(λi ψi(x))(λi ψi(x))=i=1λiψi(x)ψi(x)=K(x,x)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/80803.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

谈谈未来iOS越狱或巨魔是否会消失

2024年10月的预测&#xff0c;先说结论&#xff1a; 巨魔iOS17.1消失概率为99%。 因为巨魔强依赖的漏洞就是一个签名漏洞&#xff0c;攻击面有限又经过2轮修复&#xff0c;第3次出现漏洞的概率极低。而越狱的话由于系统组件和服务较多&#xff0c;所以出现漏洞概率高攻击面多&…

根据当前日期计算并选取上一个月和上一个季度的日期范围,用于日期控件的快捷选取功能

1.选择月份范围 代码如下&#xff1a; <el-date-picker v-model"value" type"monthrange" align"right" unlink-panels range-separator"至"start-placeholder"开始月份" end-placeholder"结束月份" :picker-…

用户栈的高效解析逻辑

一、背景 在之前的博客 内核逻辑里抓取用户栈的几种方法-CSDN博客 里&#xff0c;介绍了使用内核逻辑进行用户栈的函数地址的抓取逻辑&#xff0c;但是并没有涉及如何解析出函数符号的逻辑。 就如perf工具一样&#xff0c;它也是分为两个步骤&#xff0c;一个步骤是内核态抓取…

vue3 el-table 行号

在 Vue 3 中&#xff0c;使用 Element Plus 的 <el-table> 组件来创建表格时&#xff0c;如果你想添加行号&#xff08;即每一行的编号&#xff09;&#xff0c;可以通过自定义列来实现。下面是如何实现的步骤&#xff1a; 1. 安装 Element Plus 首先&#xff0c;确保你…

Linux:进程信号---信号的保存与处理

文章目录 1. 信号的保存1.1 信号的状态管理 2. 信号的处理2.1 用户态与内核态2.2 信号处理和捕捉的内核原理2.3 sigaction函数 3. 可重入函数4. Volatile5. SIGCHLD信号 序&#xff1a;在上一章中&#xff0c;我们对信号的概念及其识别的底层原理有了一定认识&#xff0c;也知道…

UML 图的细分类别及其应用

统一建模语言&#xff08;UML&#xff0c;Unified Modeling Language&#xff09;是一种用于软件系统建模的标准化语言&#xff0c;广泛应用于软件工程领域。UML 图分为多种类别&#xff0c;每种图都有其特定的用途和特点。本文将详细介绍 UML 图的细分类别&#xff0c;包括 类…

「极简」扣子(coze)教程 | 小程序UI设计进阶!控件可见性设置

大师兄在上一期的内容中对用户的UI做了一些简单的介绍。这期大师兄继续介绍UI设计上的进阶小技巧&#xff0c;帮我们获得更好的使用体验。 扣子&#xff08;coze&#xff09;编程 「极简」扣子(coze)教程 | 3分钟学会小程序UI设计&#xff01;从零开始创建页面和瓷片按钮 「极…

2025年渗透测试面试题总结-快手[实习]安全工程师(题目+回答)

网络安全领域各种资源&#xff0c;学习文档&#xff0c;以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具&#xff0c;欢迎关注。 目录 快手[实习]安全工程师 一面问题分析与详细回答 1. 自我介绍 4. 项目问题与解决 7. 防止SQL注入&…

WordPress Madara插件存在文件包含漏洞(CVE-2025-4524)

免责声明 本文档所述漏洞详情及复现方法仅限用于合法授权的安全研究和学术教育用途。任何个人或组织不得利用本文内容从事未经许可的渗透测试、网络攻击或其他违法行为。使用者应确保其行为符合相关法律法规,并取得目标系统的明确授权。 对于因不当使用本文信息而造成的任何直…

互联网大厂Java面试场景:从Spring Boot到分布式缓存技术的探讨

互联网大厂Java面试场景&#xff1a;从Spring Boot到分布式缓存技术的探讨 场景描述 互联网大厂某次Java开发岗面试&#xff0c;主考官是一位严肃的技术专家&#xff0c;而应聘者则是搞笑的程序员“码农明哥”。面试围绕音视频场景的技术解决方案展开&#xff0c;探讨从Sprin…

leetcode hot100刷题日记——8.合并区间

class Solution { public:vector<vector<int>> merge(vector<vector<int>>& intervals) {if(intervals.empty()){//复习empty函数啊&#xff0c;日记1有的return {};}// 按照区间的起始位置进行排序sort(intervals.begin(), intervals.end());vect…

Unity中GPU Instancing使用整理

GPU Instancing是一种绘制调用优化方法,可在单个绘制调用中渲染具有相同材质Mesh的多个副本(实例),可用于绘制在场景中多次出现的几何体(例如,树木或灌木丛),在同一绘制调用中渲染相同的网格,每个实例可以具有不同的属性(如 Color 或 Scale),渲染多个实例的绘制调用…

【后端】【UV】【Django】 `uv` 管理的项目中搭建一个 Django 项目

&#x1f680; 一步步搭建 Django 项目&#xff08;适用于 uv pyproject.toml 项目结构&#xff09; &#x1f9f1; 第 1 步&#xff1a;初始化一个 uv 项目&#xff08;如果还没建好&#xff09; uv init django-project # 创建项目&#xff0c;类似npm create vue⚙️ 第 …

Linux操作系统之进程(二):进程状态

目录 前言 一、补充知识点 1、并行与并发 2、时间片 3、 等待的本质 4、挂起 二. 进程的基本状态 三、代码演示 1、R与S 2、T 3、Z 四、孤儿进程 总结&#xff1a; 前言 在操作系统中&#xff0c;进程是程序执行的基本单位。每个进程都有自己的状态&#xff0c;这些…

大数据技术全景解析:HDFS、HBase、MapReduce 与 Chukwa

大数据技术全景解析&#xff1a;HDFS、HBase、MapReduce 与 Chukwa 在当今这个信息爆炸的时代&#xff0c;大数据已经成为企业竞争力的重要组成部分。从电商的用户行为分析到金融的风险控制&#xff0c;从医疗健康的数据挖掘到智能制造的实时监控&#xff0c;大数据技术无处不…

学习 Android(十一)Service

简介 在 Android 中&#xff0c;Service 是一种无界面的组件&#xff0c;用于在后台执行长期运行或跨进程的任务&#xff0c;如播放音乐、网络下载或与远程服务通信 。Service 可分为“启动型&#xff08;Started&#xff09;”和“绑定型&#xff08;Bound&#xff09;”两大…

投标环节:如何科学、合理地介绍 Elasticsearch 国产化替代方案——Easysearch?

一、Easysearch 定义 Easysearch 是由极限科技&#xff08;INFINI Labs&#xff09;自主研发的分布式搜索型数据库&#xff0c;作为 Elasticsearch 的国产化替代方案&#xff0c;基于 Elasticsearch 7.10.2 开源版本深度优化[1]。 插一句&#xff1a;Elasticsearch 7.10.2 是里…

NVC++ 介绍与使用指南

文章目录 NVC 介绍与使用指南NVC 简介安装 NVC基本使用编译纯 C 程序编译 CUDA C 程序 关键编译选项示例代码使用标准并行算法 (STDPAR)混合 CUDA 和 C 优势与限制优势限制 调试与优化 NVC 介绍与使用指南 NVC 是 NVIDIA 提供的基于 LLVM 的 C 编译器&#xff0c;专为 GPU 加速…

Veo 3 可以生成视频,并附带配乐

谷歌最新的视频生成 AI 模型 Veo 3 可以创建与其生成的剪辑相配的音频。 周二&#xff0c;在谷歌 I/O 2025 开发者大会上&#xff0c;谷歌发布了 Veo 3。该公司声称&#xff0c;这款产品可以生成音效、背景噪音&#xff0c;甚至对话&#xff0c;为其制作的视频增添配乐。谷歌表…

Android本地语音识别引擎深度对比与集成指南:Vosk vs SherpaOnnx

技术选型对比矩阵 对比维度VoskSherpaOnnx核心架构基于Kaldi二次开发ONNX Runtime + K2新一代架构模型格式专用格式(需专用工具转换)ONNX标准格式(跨框架通用)中文识别精度89.2% (TDNN模型)92.7% (Zipformer流式模型)内存占用60-150MB30-80MB迟表现320-500ms180-300ms多线程…