【什么是机器学习——多项式逼近】

什么是机器学习——多项式逼近

  机器学习可以分成三大类别,监督学习、非监督学习、强化学习。三大类别背后的数学原理不同。监督学习使用了数学分析中的函数逼近方法和概率统计中的极大似然方法;非监督学习使用聚类和EM算法;强化学习使用马尔可夫决策过程的想法。


机器学习的本质就是寻找数据间的关联或者关系。

文章目录

  • 什么是机器学习——多项式逼近
  • 前言
  • 一、什么是机器学习?
    • 数学语言——叙述机器学习问题
  • 二、多项式逼近函数
    • 1.拉格朗日插值公式———Cramer法则
    • 2.函数逼近——Cauchy矩阵
  • 三、多项式Remez算法
    • 1.最佳逼近函数
    • 2. Remez 算法
  • 参考文献


前言

数据间的关系直观上来说就两种:

  一种是确定性的关系,如函数的对应关系;另一种是不确定的、带有一定概率意义上的或者统计上的关系,比如联合分布、条件分布等。


一、什么是机器学习?

虽然机器学习的深入研究需要用到高深的数学和计算机知识,但是机器学习的具体例子在我们平时的工作和学习中早已用到。

  比如在下面这些二维数据中找出对应关系,并在问号处填上合适的数字。

(1,2),(2,4),(3,6),(4,8),(5,10),(6, ?)
通常小朋友会填写12,这就是一个典型的机器学习问题。又比如下面序列中的数字是一个一个列出来的
1,1,2,3,5,8,13,21,34,55,?
发现前面的若干项正好是斐波那契数列,所以问号处填89.
上述都比较简单,但是有些问题就比较困难。例如,给定一个序列,根据前面几项,预测最后一个数字是多少。

41,23,9,7,1,3,-1,?
  仔细观察可以发现,每两项之和都是2的幂次,而且幂次依次递减,由此可知应该填写1。总结上述问题,可以归纳抽象出共同的要素。给出一组数据,其背后存在一个确定的对应关系,这种关系可能是数组的第一个分量和第二个分量之间的关系,也可能是从第一个数据到第二数据之间的迭代关系。给出的数据可能是所有数据的一个子集,我们的目标是通过这个子集去了解全貌,从而找到隐藏在背后的对应关系。

数学语言——叙述机器学习问题

  有两个集合 Ω \Omega Ω A \mathrm{A} A,在它们之间有对应关系 f : Ω → A f: \Omega \rightarrow A f:ΩA。这种对应关系我们称为函数,从而对于 x ∈ Ω x \in \Omega xΩ有唯一对应的 f ( x ) ∈ A f(x) \in A f(x)A,但是这个对应关系 f f f我们不知道。为此,我们能够接触到的是全集 Ω \Omega Ω上的一个子集 S ⊂ Ω S \subset \Omega SΩ,同时每个 x ∈ S x \in S xS对应的 f ( x ) f(x) f(x)已知,即作为数据 { ( x , f ( x ) ) : x ∈ S } \begin{array}{l} \{(x, f(x)): x \in S\} \end{array} {(x,f(x)):xS} 是已知的,但是对应关系的算法描述我们是不知道的。我们需要通过这组数据(也称为样本数据)试图去寻找本源的对应关系,从而在全集 Ω \Omega Ω中任意给定一个新的 x ∈ Ω x \in \Omega xΩ,可以知道对应的 y = f ( x ) y=f(x) y=f(x)。上述使用函数的数学方法虽然结果令人满意,但是未必满足机器学习所有的问题形式。
  下面考虑另外一个问题,一个袋子里有很多个球,一部分是红色的球,一部分是黑色的球。分别把球一个一个拿出来,看到颜色以后在放回去。例如,分别是红、红、黑、红、黑、黑、红、红。那么下一个拿出来的球应该是红色还是黑色呢?
在这里插入图片描述
  这个问题就带着强烈的概率色彩。如果取球过程充分随机,绝对不可能因为取出来红色和黑色的球就断言所有球的颜色仅仅有红色和黑色,显然什么颜色的球都有可能出现,所以我们仅能在概率的意义上来问取到红色球和黑色球的概率分别是多少。
  把这个概率问题用数学语言来叙述就是:两个随机变量 X , Y X,Y X,Y,它们的联合分布记为 p ( x , y ) p(x, y) p(x,y)。虽然联合分布没有给出具体形式,但是给出了有限个样本点集 ( x 1 , y 1 ) , ( x 2 , y 2 ) , ⋅ ⋅ ⋅ , ( x n , y n ) \begin{array}{l} ( x_1,y_1),( x_2,y_2 ),···,( x_n,y_n) \end{array} x1,y1,x2,y2,⋅⋅⋅,xn,yn我们需要从中学习到联合分布。一旦联合分布给出就很容易计算边缘分布 p ( x ) = ∫ R p ( x , y ) d y p ( y ) = ∫ R p ( x , y ) d x \begin{array}{l} p(x)=\int_{\mathbb{R}} p(x, y) \mathrm{d} y\\ p(y)=\int_{\mathbb{R}} p(x, y) \mathrm{d} x \end{array} p(x)=Rp(x,y)dyp(y)=Rp(x,y)dx以及对于任意一个 x x x,对应的是 y y y的条件分布 p ( y ∣ x ) = p ( x , y ) p ( x ) \begin{array}{l}p(y \mid x)=\frac{p(x, y)}{p(x)}\end{array} p(yx)=p(x)p(x,y)经过我们抽象出来的问题,无论是确定性问题还是统计性问题,都涉及学习和预测。学习过程可以看做从样本内找到一定关系;预测过程就是把学习到的关系使用在样本外。

二、多项式逼近函数

1.拉格朗日插值公式———Cramer法则

  在基础的数学理论中,也可以找到非常明显的机器学习的影子,那就是函数逼近理论。本节将回顾这个理论并且从机器学习的角度来重新阐述一些重要的原则。已知有若干有限个一维实数空间的点和在这些点上的函数值,根据这些信息来预测这个函数在其他点的取值。这个传统的数学领域和机器学习的目标非常相似。下面我们用数学语言来精确描述问题。
  给出直线上的一个区间 [ 0 , 1 ] [0,1] [0,1],有一个实值函数使得 f : [ 0 , 1 ] → R f:[0,1]→R f:[0,1]R,但是我们不知道这个函数是什么形式。与此同时,给出 [ 0 , 1 ] [0,1] [0,1]区间上的一个离散点集
О < x 1 < x 2 < … < x n < 1 \begin{array}{l} О< x_1< x_2<…< x_n<1\end{array} О<x1<x2<<xn<1
以及一组对应的函数值
y i = f ( x 1 ) , y 2 = f ( x 2 ) , … , y n = f ( x n ) \begin{array}{l} y_i=f(x_1),y_2=f(x_2),…,y_n=f(x_n)\end{array} yi=f(x1)y2=f(x2),yn=f(xn)我们试图通过这些有限数据推测出原来的函数关系。那么什么样的函数可以精确地给出这种对应关系呢?常见的可以选择多项式。根据多项式理论,任何一个 n − 1 n-1 n1 次的多项式
g ( x ) = a n − 1 x n − 1 + a n − 2 x n − 2 + ⋯ + a 1 x + a 0 \begin{array}{l} g(x)=a_{n-1} x^{n-1}+a_{n-2} x^{n-2}+\cdots+a_{1} x+a_{0} \end{array} g(x)=an1xn1+an2xn2++a1x+a0使得能够满足对于任何 0 < i < n 0<i<n 0<i<n
g ( x i ) = y i \begin{array}{l} g(x_i)=y_i \end{array} g(xi)=yi这个问题就相当于求解一系列的关于多项式系数的线性方程
( 1 x 1 x 1 2 ⋯ x 1 n − 1 1 x 2 x 2 2 ⋯ x 2 n − 1 1 ⋯ ⋯ ⋯ ⋯ 1 x n x n 2 ⋯ x n n − 1 ) ( a 0 a 1 ⋯ a n − 1 ) = ( y 1 y 2 ⋯ y n ) \begin{array}{l} \left(\begin{array}{ccccc} 1 & x_{1} & x_{1}^{2} & \cdots & x_{1}^{n-1} \\ 1 & x_{2} & x_{2}^{2} & \cdots & x_{2}^{n-1} \\ 1 & \cdots & \cdots & \cdots & \cdots \\ 1 & x_{n} & x_{n}^{2} & \cdots & x_{n}^{n-1} \end{array}\right)\left(\begin{array}{c} a_{0} \\ a_{1} \\ \cdots \\ a_{n-1} \end{array}\right)=\left(\begin{array}{c} y_{1} \\ y_{2} \\ \cdots \\ y_{n} \end{array}\right) \end{array} 1111x1x2xnx12x22xn2x1n1x2n1xnn1 a0a1an1

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/73936.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Ubuntu 22.04 上安装阿里云 CLI(命令行工具)

在 Ubuntu 22.04 上安装阿里云 CLI&#xff08;命令行工具&#xff09;可以通过以下步骤完成&#xff1a; 步骤 1&#xff1a;下载阿里云 CLI 安装包 打开终端&#xff0c;首先更新你的软件包索引&#xff1a; sudo apt update安装 curl&#xff08;如果还没有安装&#xff09…

​Android Gradle 插件(AGP)版本与 ​Gradle 版本需要严格对应

一、AGP 与 Gradle 版本对照表 Android Gradle 插件版本对应 Gradle 版本适用 Android Studio 版本​8.1.x8.2Arctic Fox (2020.3.1+)​8.0.x8.0Arctic Fox (2020.3.1+)​7.4.x7.5.1IntelliJ IDEA 2022+​7.3.x7.4IntelliJ IDEA 2022+​7.2.x7.3.3IntelliJ IDEA 2021.3+​7.1.x…

【Matlab】-- 基于MATLAB的灰狼算法优化支持向量机的回归算法

文章目录 文章目录 01 内容概要02 GWO-SVR模型03 部分代码04 运行结果05 参考文献06 代码下载 01 内容概要 GWOSVR&#xff08;基于灰狼算法优化的支持向量机回归&#xff09;是一种先进的机器学习技术&#xff0c;它结合了灰狼优化算法&#xff08;Grey Wolf Optimizer, GWO…

Google Play Games PC版即将正式上线!

早在 2021 年&#xff0c;谷歌就推出 Google Play Games PC 版&#xff0c;本质上是基于虚拟化创建安卓系统在 Windows 上运行 Google Play 平台的各种游戏。 在测试了 4 年后&#xff0c;谷歌准备在今年晚些时候正式上线该平台&#xff0c;谷歌将在下周举办 2025 游戏开发者大…

【SpringBoot】深入解析使用配置文件解决硬编码问题综合练习(三):解析验证码拓展问题

校验输入验证码接口 check( ) 5. 为什么要用静态内部类接收配置文件中的 Seisson 对象&#xff1f; 为什么我们接收配置文件的 Session 对象时&#xff0c;使用静态内部类给 Session 对象的 key&#xff0c;date 属性赋值呢&#xff1f;不加 static 可以吗&#xff1f; 在 Cap…

day16 学习笔记

文章目录 前言一、广播机制二、数组遍历1.for循环2.nditer函数 三、数组操作1.reshape函数2.flat属性3.flatten函数4.revel函数5.数组转置6.升维与降维7.数组的连接与分割8.数组运算 前言 通过今天的学习&#xff0c;我进一步掌握了更多numpy的语法知识 一、广播机制 广播&am…

使用FastExcel时的单个和批量插入的问题

在我们用excel表进行插入导出的时候&#xff0c;通常使用easyexcel或者FastExcel&#xff0c;而fastexcel是easy的升级版本&#xff0c;今天我们就对使用FastExcel时往数据库插入数据的业务场景做出一个详细的剖析 场景1 现在我们数据库有一张组织表&#xff0c;组织表的字段…

Cannot find a valid baseurl for repo: centos-sclo-sclo/x86_64

​ rpm -Uvh https://repo.zabbix.com/zabbix/5.0/rhel/7/x86_64/zabbix-release-latest-5.0.el7.noarch.rpmyum clean allyum macache fast​ 编辑配置文件 /etc/yum.repos.d/zabbix.repo and enable zabbix-frontend repository. [zabbix-frontend]...enabled1... 下载相关…

AI基础02-图片数据采集

上篇文章我们学习了文本的数据采集&#xff0c;今天主要了解一下图片数据采集的方法。图片采集方法通常有网页采集和实时采集&#xff08;传感器采集&#xff09;两种。我们学习一下如何利用python 工具和笔记本计算机摄像头进行图片数据的实时采集。 1&#xff09;cv2库简介 …

【CSS】相对位置小练习

要求&#xff1a; 成果&#xff1a; 代码&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>相对位置小练习</title><link rel"stylesheet" href"./css/style.css…

外设的中断控制

如ADC、SPI、I2C、TIM等使用STM32 HAL库时的中断函数调用方式和UART非常类似&#xff0c;都有底层直接使能中断和上层库函数管理两种方式。下面详细说明几种典型外设&#xff1a; 一、ADC外设 &#xff08;1&#xff09;直接使能中断&#xff08;底层控制&#xff09;&#xf…

网络传输优化之多路复用与解复用

一、基本概念 多路复用 发送端将来自多个应用或进程的数据流合并到同一物理信道中传输的过程。核心目的是提高信道利用率&#xff0c;减少资源浪费。例如&#xff0c;多个网络应用&#xff08;如浏览器、邮件客户端&#xff09;通过不同端口将数据封装为报文段&#xff0c;共享…

【软考-架构】10.1、软件工程概述-CMM-软件过程模型-逆向工程

✨资料&文章更新✨ GitHub地址&#xff1a;https://github.com/tyronczt/system_architect 文章目录 软件工程基础知识软件工程概述能力成熟度模型能力成熟度模型CMM能力成熟度模型集成CMMI &#x1f4af;考试真题第一题第二题 软件过程模型瀑布模型&#xff08;SDLC&#…

python将整个txt文件写入excel的一个单元格?

要将整个txt文件写入Excel的一个单元格&#xff0c;可以使用Python的openpyxl库来实现。以下是一个简单的示例代码&#xff1a; from openpyxl import Workbook# 读取txt文件内容 with open(file.txt, r) as file:txt_content file.read()# 创建一个新的Excel工作簿 wb Work…

车载以太网网络测试 -25【SOME/IP-报文格式-1】

1 摘要 本专题接着上一专题对SOME/IP进行介绍&#xff0c;主要对SOME/IP报文格式以及定义的字段进行详细介绍&#xff0c;有助于在实际项目过程中对SOME/IP报文的理解。 上文回顾&#xff1a; 车载以太网网络测试 -24【SOME/IP概述】 2 SOME/IP-报文格式 通过上个专题介绍&a…

【区块链安全 | 第五篇】DeFi概念详解

文章目录 DeFi1. DeFi 生态概览2. 去中心化交易所&#xff08;DEX&#xff09;2.1 AMM&#xff08;自动做市商&#xff09;模型2.2 订单簿模式&#xff08;现货交易&#xff09; 3. 借贷协议3.1 Aave3.2 使用闪电贷&#xff08;Flash Loan&#xff09; 4. 稳定币&#xff08;St…

问题:md文档转换word,html,图片,excel,csv

文章目录 问题&#xff1a;md文档转换word&#xff0c;html&#xff0c;图片&#xff0c;excel&#xff0c;csv&#xff0c;ppt**主要职责****技能要求****发展方向****学习建议****薪资水平** 方案一&#xff1a;AI Markdown内容转换工具打开网站md文档转换wordmd文档转换pdfm…

代码随想录刷题day53|(二叉树篇)106.从中序与后序遍历序列构造二叉树(▲

目录 一、二叉树理论知识 二、构造二叉树思路 2.1 构造二叉树流程&#xff08;给定中序后序 2.2 整体步骤 2.3 递归思路 2.4 给定前序和后序 三、相关算法题目 四、易错点 一、二叉树理论知识 详见&#xff1a;代码随想录刷题day34|&#xff08;二叉树篇&#xff09;二…

前端知识点---用正则表达式判断邮箱(javascript)

// 全面的正则&#xff08;兼容大多数情况&#xff09; const emailRegex /^[a-zA-Z0-9._%-][a-zA-Z0-9.-]\.[a-zA-Z]{2,}$/;// 或直接使用浏览器内置验证 <input type"email" required>/&#xff1a;正则表达式的起始和结束标志。 ^&#xff1a;匹配字符串的…

PyQt6实例_批量下载pdf工具_界面开发

目录 前置&#xff1a; 代码&#xff1a; 视频&#xff1a; 前置&#xff1a; 1 本系列将以 “PyQt6实例_批量下载pdf工具”开头&#xff0c;放在 【PyQt6实例】 专栏 2 本系列涉及到的PyQt6知识点&#xff1a; 线程池&#xff1a;QThreadPool,QRunnable&#xff1b; 信号…