机器学习简单概述

Chatgpt回答

  • 机器学习:机器学习是人工智能的一个分支,侧重于通过数据训练模型,使计算机能够根据数据进行预测、分类、回归等任务。它通过算法从历史数据中学习规律,然后在新数据上进行推断。机器学习包括多种算法,如**线性回归、决策树、支持向量机(SVM)、K最近邻(KNN)**等。
  • 深度学习:深度学习是机器学习的一个子集,它基于人工神经网络(特别是深层神经网络)来模拟人类大脑的学习方式。深度学习能够处理复杂的数据结构(如图像、语音、文本等),并能够自动从原始数据中提取特征,而不需要人工特征工程。

1.统计学习方法概论

监督学习:告诉它哪些东西是好的,哪些东西是坏的,依据这些来学习。
实现步骤:1.得到一个有限的训练数据集合;2.确定模型的假设空间,也就是所有的备选模型;3.确定模型选择的准则,即学习策略;4.实现求解最优模型的算法;5.通过学习方法选择最优模型;6.利用学习的最优模型对新数据进行预测或分析

数据集的划分

  • 训练集:模型的训练
  • 测试集:模型的选择
  • 验证集:模型的评估
  1. 统计学习路线:设计模型->训练->预测
  2. 监督学习与非监督学习的联系与区别
  3. 统计学习三要素:模型、策略、算法
  4. 模型的评估:训练误差、验证误差、测试误差
  5. 正则化与交叉严重
  6. 泛化能力:泛化误差上界
  7. 生成模型与判别模型的联想与区别
  8. 分类问题:准确率、精确率、召回率、F1值
  9. 标准问题
  10. 回归问题:输出为连续的值

2.感知机——入门的垫脚石

超平面

  1. 感知机通过构造超平面的形式划分不同类的点。
  2. 感知机属于线性判别模型,因为它的判别边界是线性的。
  3. 函数间隔和几何间隔的区别

3.K近邻——物以类聚

  1. K近邻的思想:物以类聚
  2. K近邻没有显式的训练过场
  3. 距离度量:欧式距离、曼哈顿距离、切比雪夫距离
    • 欧式距离:两点之间直线
    • 曼哈顿距离:城市街区距离
    • 切比雪夫距离:棋盘距离
  4. 分类方式:多数表决规则

欧式距离、曼哈顿距离、切比雪夫距离

4.朴素贝叶斯

条件概率公式:
P ( A ∣ B ) = P ( A B ) P ( B ) = P ( B ∣ A ) P ( A ) P ( B ) P(A \mid B)=\frac{P(A B)}{P(B)}=\frac{P(B \mid A) P(A)}{P(B)} P(AB)=P(B)P(AB)=P(B)P(BA)P(A)
表示已发生事件B的情况下,事件A发生的概率。

5.决策树——每次选一边

信息熵:在信息论与概率统计中,熵(entropy)是表示随机变量不确定性的度量。
熵越大,则随机变量的不确定性越大。

信息增益:表示得知特征X的信息而使得类Y的信息的不确定性减少的程度。
信息增益算法
输入:训练数据集D和特征A
输出:特征A对训练数据集D的信息
信息增益比:
如果以信息增益为划分依据,存在偏向选择取值较多的特征,信息增益是对这一问题进行矫正。

  1. 决策树的核心思想:以树结构为基础,每个节点对某特征进行判断,进入分支,直到到达叶节点。
  2. 决策树构造的核心思想:让信息熵快速下降,从而达到最少的判断次数获得标签。
  3. 判断信息熵下降速度的方法:信息增益。
  4. 构建决策树算法:ID3(使用信息增益)、C4.5(使用使用信息增益比)。
  5. 信息增益会导致节点偏向选取取值角度的特征的问题。

6.逻辑斯蒂回归于最大熵

  1. 逻辑斯蒂以输出概率的形式解决了极小距离带来的+1和-1的天壤之别,同时概率也可作为模型输出的置信程度。
  2. 逻辑斯蒂使得了最终的模型函数连续可微,训练目标与预测目标达成一致。
  3. 逻辑斯蒂采用了较大似然估计来估计参数。

最大熵:趋向于均匀分布,即可最大

7.支持向量机——升维打击

Support vector machines (SVM)

这里提到了最优超平面,在感知机里面,我们说的是超平面,现在通过SVM升维,存在最优超平面,就不是线性的了。

升维一定会线性可分?会不会升到无穷维了仍然线性不可分?
答案是不会的,首先要明白,我们的数据集一定是基于真实的某种分布,分为A类的样本和B类的一定在本质上有区别。只要有区别,就一定可以区分开来,一定在某个高维度上线性可分。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/79389.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

openjdk底层汇编指令调用(一)——汇编指令及指令编码基础

汇编指令 计算机在执行过程时只识别代表0或者1的电信号。因此为了让计算机能够执行则须向计算机输入一系列01构成的指令。 例如在x64平台下,0x53,二进制为01010011,表示将rbx寄存器中的值压栈。 但是,对于程序员而言,…

Python Day 22 学习

学习讲义Day14安排的内容:SHAP图的绘制 SHAP模型的基本概念 参考学习的帖子:SHAP 可视化解释机器学习模型简介_shap图-CSDN博客 以下为学习该篇帖子的理解记录: Q. 什么是SHAP模型?它与机器学习模型的区别在哪儿? …

48.辐射发射RE和传导发射CE测试方法分析

辐射发射RE和传导发射CE测试方法分析 1. 所有测试项目总结2. 辐射发射RE测试方法3. 传到发射CE测试方法 1. 所有测试项目总结 所有EMC测试项目都是基于模拟现实的。 模拟现实中可能发生的各种真实场景,然后统计总结出各种场景下的真实应力,并通过制造测…

在 Vue 3 中实现刮刮乐抽奖

🎉 在 Vue 3 中实现刮刮乐抽奖 当项目中需要做一些活动互动页时,需要实现刮刮乐,请看如下效果: 这里感谢github用户Choicc分享的组件,具体可点击传送门查看 1. 引入组件 将/src/components下ScratchCard.vue复制到自…

c语言第一个小游戏:贪吃蛇小游戏01

hello啊大家好 今天我们用一个小游戏来增强我们的c语言! 那就是贪吃蛇 为什么要做一个贪吃蛇小游戏呢? 因为这个小游戏所涉及到的知识有c语言的指针、数组、链表、函数等等可以让我们通过这个游戏来巩固c语言,进一步认识c语言。 一.我们先…

实战项目1(02)

目录 任务场景一 【sw1和sw2的配置如下】 任务场景二 【sw3的配置】 【sw4-6的配置】 任务场景一 某公司有生产、销售、研发、人事、财务等多个部门,这些部门分别连接在两台交换机(SW1和SW2)上,现要求给每个部门划分相应的V…

Kubernetes生产实战(十四):Secret高级使用模式与安全实践指南

一、Secret核心类型解析 类型使用场景自动管理机制典型字段Opaque (默认)自定义敏感数据需手动创建data字段存储键值对kubernetes.io/dockerconfigjson私有镜像仓库认证kubelet自动更新.dockerconfigjsonkubernetes.io/tlsTLS证书管理Cert-Manager可自动化tls.crt/tls.keykube…

Linux: 信号【阻塞和捕捉信号】

Linux: 信号【阻塞和捕捉信号】 (一)阻塞信号1.信号其他相关的概念2.在内核中表示3.sigset_t4.信号集操作函数5.sigprocmask(设置阻塞)6.sigpending(得到未决状态) (二)捕…

MySQL 数据库集群部署、性能优化及高可用架构设计

MySQL 数据库集群部署、性能优化及高可用架构设计 集群部署方案 1. 主从复制架构 传统主从复制:配置一个主库(Master)和多个从库(Slave)GTID复制:基于全局事务标识符的复制,简化故障转移半同步复制:确保至少一个从库接收到数据…

Java 多态:原理与实例深度剖析

一、多态概述 在 Java 面向对象编程体系中,多态是构建灵活、可扩展程序的核心机制之一,与封装、继承并称为面向对象的三大特性。其本质是同一操作作用于不同对象,产生不同的执行结果,这使得程序在运行时能根据实际对象类型动态调…

解决使用宝塔Linux部署前后端分离项目遇到的问题

问题一:访问域名转圈圈,显示404,403 没有解决跨域问题,在后端yml中设置content:/prod(生产环境),在前端.env文件中将http://127.0.0.1:8080/替换为公网IP,并在vite.conf…

《Python星球日记》 第54天:卷积神经网络进阶

名人说:路漫漫其修远兮,吾将上下而求索。—— 屈原《离骚》 创作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊) 目录 一、深度CNN架构解析1. LeNet-5(1998)2. AlexNet&#x…

旅游设备生产企业的痛点 质检系统在旅游设备生产企业的应用

在旅游设备制造行业,产品质量直接关系到用户体验与企业口碑。从景区缆车、观光车到水上娱乐设施,每一件设备的安全性与可靠性都需经过严苛检测。然而,传统质检模式常面临数据分散、流程不透明、合规风险高等痛点,难以满足旅游设备…

MySql(进阶)

一.数据库约束 约束类型 NOT NULL - 指示某列不能存储 NULL 值。 (not null不能为NILL) UNIQUE - 保证某列的每行必须有唯一的值。 (unique唯一值) DEFAULT - 规定没有给列赋值时的默认值。 (default为空给定默认值) PRIMARY…

Three.js + React 实战系列 - 联系方式提交表单区域 Contact 组件✨(表单绑定 + 表单验证)

对个人主页设计和实现感兴趣的朋友可以订阅我的专栏哦!!谢谢大家!!! 在现代网页中,一个精致的 Contact 区域不仅仅是表单的堆砌,更是用户与我们建立联系的第一印象。 在本节课中,我…

UOJ 164【清华集训2015】V Solution

Description 给定序列 a ( a 1 , a 2 , ⋯ , a n ) a(a_1,a_2,\cdots,a_n) a(a1​,a2​,⋯,an​),另有序列 h h h,初始时 h a ha ha. 有 m m m 个操作分五种: add ⁡ ( l , r , v ) \operatorname{add}(l,r,v) add(l,r,v):…

C++开发过程中的注意事项详解

目录 C++开发过程中的注意事项详解 一、内存管理:避免泄漏与资源浪费 1.1 使用智能指针管理动态内存 1.2 避免手动内存管理的陷阱 1.3 利用RAII机制管理资源 1.4 容器与内存分配 二、安全性:防御攻击与未定义行为 2.1 输入验证与安全编码 2.2 使用安全的通信协议 2…

Git 时光机:修改Commit信息

前言 列位看官都知道,Git 的每一次 git commit,其中会包含作者(Author)和提交者(Committer)的姓名与邮箱。有时可能会因为配置错误、切换了开发环境,或者只是单纯的手滑,导致 commi…

QSFP+、QSFP28、QSFP-DD接口分别实现40G、100G、200G/400G以太网接口

常用的光模块结构形式: 1)QSFP等效于4个SFP,支持410Gbit/s通道传输,可通过4个通道实现40Gbps传输速率。与SFP相比,QSFP光模块的传输速率可达SFP光模块的四倍,在部署40G网络时可直接使用QSFP光模块&#xf…

好用的播放器推荐

以下是一些好用的播放器推荐,按照不同平台和使用场景分类: 电脑端 VLC Media Player 特点:开源、跨平台,支持几乎所有的音视频格式,无需额外安装解码器。具备强大的功能,如播放列表管理、视频和音频滤镜、…