机器学习概述学习心得

机器学习一般通过python语言进行学习 ,而python中含有机器学习丰富的第三方库

例如python中的scikit-learn

安装方式也很简单只需要执行: pip install scikit-learn 即可

机器学习的官网是: http://scikit-learn.org/stable/

本篇文章是主要内容是描述一些机器学习中的基本概念

主要内容包括:

- 人工智能发展相关概述

- 机器学习发展三要素

- 机器学习算法分类

- 机器学习基本建模流程

- 机器学习常用术语

- 特征工程概念入门

- 模型拟合问题概念入门

1. 人工智能发展相关概述:

人工智能三大概念: 人工智能(AI) ,机器学习(ML) ,深度学习(DL)

1956年是人工智能的元年 ,人工智能这一词汇在这一年的会议上被提出

人工智能( AI )之父: 约翰麦卡锡

什么是人工智能(AI)呢?

AI->用计算机模拟人脑 ,让计算机能够像人类一样 理性的思考 ,行动

机器学习( ML )之父: 亚瑟塞缪尔

什么是机器学习呢?

ML->赋予计算机学习能力而不需要明确编程的研究领域

人脑处理问题是根据经验 ,通过不断地输入归纳总结 ,从而达到回答一些问题以及对一些事物做出反应

而机器学习与之类似 ,先通过各种数据训练我们的模型 ,让计算机自己找规律找公式 ,从而达到回答一些问题的目的

什么是深度学习(DL)呢?

DL->通过大脑仿生 ,设计一层一层的神将元模拟万事万物

这三者之间的关系就是 AI 包含 ML 包含 DL

规范编程与自动学习

上面解释机器学习时提到的明确编程又名规范编程

规范编程: 程序员根据经验利用手工的 if - else 的方式进行预测

自动学习: 从数据中自动学出规律学出公式

利用进行房价预测时 ,我们根据房子的住房面积 ,可以达到基本预测的效果 ,即面积越大 房价越高

而规范编程就是程序员根据自己的理解根据不同的面积设计程序输出不同的房价

自动学习就是我们将一些 面积与销售价钱 交给计算机 ,让计算机根据数据中的规律帮我们训练出一套公式

机器学习常用术语

上图中例如标签 ,样本等名词就是机器学习中的一些基本术语

在训练模型时 ,我们需要传给电脑很多的数据 ,根据数据的一系列特征 预测出对应的结果

- 样本:一条数据就是一个样本 ,多个样本组合构成数据集

- 特征:就是模型预测的基准 ,有时也被称为属性

- 标签:模型要预测的结果

一个样本即一条数据一般包含 特征 和 标签 两部分

- 数据集分为两部分 训练集 与 测试集 比例一般为 8:2 7:3

训练集就是用于训练模型的数据

测试集就是在模型训练完训练集以后对测试集进行预测 ,来测试模型的准确性

机器学习发展的三要素

就是 数据 算法 算力 也是AI发展的基石

算力:

- CPU 多进行I/O密集型操作

- GPU 多进行并行计算

- TPU 多进行大型计算

机器学习算法分类

有监督 无监督 半监督

- 有监督的意思就是有特征同时有标签

有监督根据标签的不同情况又分为两类

如果标签是不连续的 ,就属于是分类问题 分类问题一般分为: 二分类 ,多分类

如果标签是连续的 ,就属于是回归问题

- 无监督的意思就是有特征但是没有标签

这时就需要根据样本间的相似性 ,对样本进行聚类 ,以发现事物内部结构及相互关系

- 半监督的意思就是一部分有标签 一部分没有标签

半监督的工作原理就是先让专家对于少量数据标注上专业的标签 ,再利用有标签的数据训练出一个模型 ,在利用该模型去套用没有标签的数据 ,最后通过询问领域专家分类结果与模型分类结果作对比 这样做就可以大幅度降低专家标记的人工成本

机器学习建模流程

- 准备数据

传入文本 ,图像 ,等数据给计算机

- 数据预处理

对于数据的筛查 ,一般用于处理数据中的缺失值以及异常值

- 特征工程

- 特征提取

- 特征预处理

- 特征降维 ,选择 ,组合

- 模型训练

- 线性回归

- 逻辑回归

- 决策树

- GBDT

- 模型预测

通过上一步训练的模型 ,对测试集数据或者测试集以外的数据进行预测

- 模型评估

- 分类评估指标

- 回归评估指标

- 聚类评估指标

- 模型部署

- 测试无问题后 ,上线使用

特征工程概念入门

利用专业背景知识和技巧处理数据 ,让机器学习算法效果更好 ,这样的过程就是特征工程

一句话概括数据与特征工程的重要性:

数据和特征决定了机器学习的上限 ,而模型和算法只是逼近这个上线而已

特征工程一般分为:

- 特征提取
- 从原始数据中只提取与任务相关的特征, 构成特征向量(由专家完成)
- 特征预处理
- 因量纲问题 ,有些特征权重对模型影响大 ,有些影响小
- 解决 :
- 归一化: (当前值-最小值)/)(最大值-最小值)
- 标准化
- 特征降维
- 原始数据维度降低 ,一般会对原始数据产生影响
- 特征选择
- 原始数据特征很多 ,选择与任务相关的其中一个特征集合子集 ,不会改变原数据
- 特征组合
- 多个特征合并成一个特征 ,利用乘法或加法来完成

模型拟合问题概述

模型拟合问题一般出现在模型训练的过程中

分为 欠拟合 正好拟合 过拟合 三种

我们追求的就是正好拟合

过拟合: 太复杂了, 学到了脏数据
欠拟合: 太简单了, 条件缺失

对于过拟合与欠拟合的分类标准就是 通过 训练集 与 测试集 来进行分类

欠拟合: 在训练集和测试集上面的表现情况都不好

过拟合: 在训练集上表现得很好 ,但是在测试集上表现得不好

泛化: 是机器学习中来评估模型拟合情况的专有名词

泛化能力越好 ,模型拟合能力越好

当两个模型之间泛化能力相同时, 需要遵循奥卡姆提到原则:

即较简单的模型比更加复杂的模型更可取

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1156223.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ESP32-CAM引脚功能图解说明:核心要点解析

深入理解ESP32-CAM引脚设计:从底层配置到实战避坑指南在嵌入式视觉系统开发中,ESP32-CAM是一个极具性价比的选择。它体积小巧、功能完整,集成了Wi-Fi通信、图像采集、本地存储和边缘计算能力,广泛应用于远程监控、智能门铃、农业传…

[特殊字符]_压力测试与性能调优的完整指南[20260113170607]

作为一名经历过无数次压力测试的工程师,我深知压力测试在性能调优中的重要性。压力测试不仅是验证系统性能的必要手段,更是发现性能瓶颈和优化方向的关键工具。今天我要分享的是基于真实项目经验的压力测试与性能调优完整指南。 💡 压力测试…

便携式气象仪:满足野外作业人员的移动气象监测需求

对于户外工作者、旅行爱好者等需要实时掌握天气变化的群体来说,便携气象站已成为不可或缺的装备。这类设备集成了专业气象监测功能,却又保持了轻巧便携的特点,让用户随时随地都能获取精准的气象数据,为出行和工作提供可靠参考。‌…

Java—排序1

本篇将详细讲解插入排序、希尔排序和堆排序三种经典排序算法,包括算法原理、执行过程、易错点分析,并为每种算法提供三道例题及详细解析。 一、插入排序(Insertion Sort) 算法原理 插入排序的核心思想是将待排序数组分为已排序和…

结合温升测试验证工业用PCB线宽电流对照表

温升实测揭秘:工业PCB走线到底能扛多大电流?从一个烧断的铜箔说起某天,一位工程师在调试一台工业变频器时发现,设备运行十几分钟后突然停机。检查发现,主板上一条看似“足够宽”的电源走线竟然局部碳化、断裂——而这根…

手把手教程:搭建AUTOSAR基础软件平台

从零搭建AUTOSAR基础软件平台:实战指南与核心原理深度剖析 你有没有遇到过这样的场景? 一个项目刚做完,客户突然提出:“能不能把这套控制逻辑移植到另一款MCU上?”你打开代码一看——满屏的寄存器操作、硬编码的CAN报…

一文说清JLink驱动安装无法识别的核心要点

一文讲透J-Link驱动装不上、认不出的底层逻辑与实战修复 你有没有遇到过这种情况: 手头项目正紧,调试关键时刻插上J-Link,结果设备管理器里只显示“未知设备”或带黄叹号的USB设备? Keil连不上,Ozone报错&#xff0…

51单片机入门项目:实现LED闪烁的核心要点

从零点亮一盏灯:51单片机LED闪烁实战全解析你有没有过这样的经历?翻开一本嵌入式教材,第一行代码就是P1 0xFE;,然后告诉你“现在P1.0口的LED亮了”。可你心里却满是问号:为什么写个寄存器灯就亮了?电平是怎…

初学51单片机必做项目:Keil流水灯代码超详细版解析

从点亮第一盏灯开始:51单片机流水灯实战全解析你有没有过这样的经历?手握开发板,烧录完程序,却只等来一片死寂——LED一动不动。那一刻的挫败感,我太懂了。当年我第一次写流水灯代码时,连P1 0xFE;这行简单…

hbuilderx开发微信小程序:实战案例从零实现

用 HBuilderX 开发微信小程序:从零搭建一个可上线的实战项目 你有没有遇到过这种情况:想快速做一个微信小程序,但官方开发者工具写代码太“原始”,没有智能提示、不支持 Git、UI 设计也费劲?更头疼的是,一…

2026武汉做网站TOP8盘点:企业数字化解决方案推荐

2026武汉企业建站:数字化转型的核心选择逻辑2026年,武汉中小微企业占市场主体超90%,外贸企业依托长江经济带加速跨境布局,本地商家在消费升级中寻求线上突围。武汉做网站不仅是搭建网页,更是企业数字化的“基础设施”—…

盘式电机 maxwell 电磁仿真模型 双转单定结构,halbach 结构,双定单转 24 槽...

盘式电机 maxwell 电磁仿真模型 双转单定结构,halbach 结构,双定单转 24 槽 20 极,18槽 1 2 极,18s16p(可做其他槽极配合) 参数化模型,内外径,叠厚等所有参数均可调整 默认模型仅作学…

Keil5 MDK安装教程:新手入门必看的环境准备清单

Keil5 MDK安装实战指南:从零搭建嵌入式开发环境 你是不是刚接触STM32,打开电脑准备写第一行代码时,却被“Keil怎么装?”、“为什么编译报错?”、“下载不了程序怎么办?”这些问题卡住?别急——…

8位加法器硬件连接与调试实战案例

从理论到板级:8位加法器硬件实战中的那些“坑”与突破你有没有遇到过这样的情况——明明逻辑设计完全正确,Verilog代码综合无误,仿真波形也完美匹配真值表,可一旦烧进FPGA、接上拨码开关和数码管,输出就开始乱跳&#…

大学生移动端作业学习数据分析程序设计与实现 微信小程序PHP_nodejs_vue+uniapp

文章目录移动端作业学习数据分析程序设计摘要系统设计与实现的思路主要技术与实现手段源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!移动端作业学习数据分析程序设计摘要 该设计基于微信小程序平台,整合PHP、Node.js、Vue.j…

Keil uVision5调试环境搭建:手把手操作指南

从零搭建Keil uVision5调试环境:工程师的实战手记最近接手一个基于STM32F4的工业控制项目,客户要求在两周内完成Bootloader开发和通信协议联调。时间紧、任务重,第一件事就是——先把调试环境搭稳。别小看这一步。我见过太多团队因为“下载失…

AD23导出Gerber文件的完整示例演示

从设计到制造:在AD23中正确导出Gerber文件的实战全解析你有没有遇到过这样的情况?PCB布局布线完成,DRC全绿,信心满满地导出Gerber发给厂家打样,结果三天后收到回复:“阻焊层缺失”、“钻孔偏移”、“丝印压…

扶贫助农系统及农副产品销售商城系统小程序的实现PHP_nodejs_vue+uniapp

文章目录扶贫助农系统及农副产品销售商城系统小程序的实现系统设计与实现的思路主要技术与实现手段源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!扶贫助农系统及农副产品销售商城系统小程序的实现 该系统采用前后端分离架构&#xff0c…

51单片机核心外设知识点总结:GPIO、按键、中断、定时器与PWM

一、GPIO:单片机与外界交互的基础接口GPIO,全称General Purpose Input Output,即通用输入输出,是单片机与外界进行数据交互的最基本形式。每个GPIO引脚都可以独立配置为输入模式或输出模式,满足不同场景的使用需求。1.…

档案馆参观预约系统 微信小程序PHP_nodejs_vue+uniapp

文章目录档案馆参观预约系统技术架构功能模块设计关键技术实现数据安全与性能优化用户体验设计系统设计与实现的思路主要技术与实现手段源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!档案馆参观预约系统技术架构 该系统采用前后端分离架…