分类概念 - -一叶知秋

news/2025/10/23 11:55:13/文章来源:https://www.cnblogs.com/blogyiyezhiqiu/p/19160175

“机器学习分类”(Machine Learning Classification)是机器学习中的一个监督学习任务,它的目标是让模型根据输入数据预测所属的类别(class)或标签(label)。简单来说,就是“根据已知样本的经验,判断新样本属于哪一类”。


🧠 一、分类的基本概念

概念 说明
输入(Feature) 样本的特征,如图片像素、身高体重、文本词频等
输出(Label) 类别,如“猫/狗”、“通过/未通过”、“正面/负面”
目标 学习一个函数 f(x),能对新样本 x 输出正确类别 y

如何区分哪个 class 是哪个呢

image-20251023110850660

用向量表示

image-20251023111011293

当把回归的一个输出改成多个输出,就是分类

🧩 二、常见分类类型

类型 示例 特点
二分类 (Binary Classification) 垃圾邮件识别(垃圾 or 非垃圾) 只有两类
多分类 (Multi-class Classification) 手写数字识别(0–9) 多于两类,且互斥
多标签分类 (Multi-label Classification) 一张图里可同时有“猫”和“狗” 可属于多个类别
层次分类 (Hierarchical Classification) “动物 → 哺乳类 → 猫科” 分类有层次结构

🔧 三、常见算法

算法 简介 优缺点
逻辑回归 (Logistic Regression) 基于线性模型的概率分类器 简单快速,适合线性可分
K近邻 (KNN) 看最近的K个样本类别 简单但计算慢
决策树 (Decision Tree) 基于特征划分构造树 可解释性强,易过拟合
随机森林 (Random Forest) 多棵树投票 准确率高,鲁棒性好
支持向量机 (SVM) 寻找最大间隔超平面 适合中小数据集
朴素贝叶斯 (Naive Bayes) 基于概率的分类器 快速,对文本分类有效
神经网络 / 深度学习 模拟人脑神经元结构 精度高但需大量数据

🧠 一、Softmax 的定义

$Softmax $ 是一种归一化函数,它可以把一组任意实数(logits)转化为一组 概率分布(各值之和为 1)。
设模型输出为一个向量:

$z=[z1,z2,…,zK]$

$Softmax $ 函数定义为:

$\text{Softmax}(z_i) = \frac{e{z_i}}{\sum_{j=1} e^{z_j}}$

其中 K 是类别数。


🧩 二、Softmax 的作用

Softmax 的主要作用:

  1. 将模型的原始输出(logits)映射成概率;
  2. 概率总和为 1;
  3. 概率最大的类别就是模型的预测结果。

例子:

类别 原始输出 ziz_izi Softmax 概率
猫 🐱 2.1 $e2.1/(e2.1+e1.2+e0.5) ≈ 0.63$
狗 🐶 1.2 ≈ 0.23
鸟 🐦 0.5 ≈ 0.14

所以模型预测 “猫” 的概率最高。


⚙️ 三、Softmax 的性质

性质 说明
非负性 每个输出都 ≥ 0
归一性 所有输出概率之和 = 1
平滑性 输出对输入的微小变化敏感但连续
放大差异性 较大的 ziz_izi 会被指数放大,更容易接近 1

🧮 四、与交叉熵 (Cross Entropy) 一起使用

在分类任务中,Softmax 通常和 交叉熵损失函数 一起使用:

$L = - \sum_{i=1}^{K} y_i \log(\hat{y_i})$

其中:

  • $y_i $是真实标签(one-hot 编码),
  • $^\hat{y_i} $是 Softmax 输出的概率。

对于单样本(真实类别为 c):

$L = - \log(\hat{y_c})$

也就是只惩罚模型对真实类别的预测概率。

image-20251023105915456

损失函数有Mean Square Error 和 Crooss-entropy

image-20251023110225750

为什么常用Cross-entropy

Mean square Error 在lagre Loss的时候很平坦,很难更新参数(训练)

image-20251023110706630

🧪 四、分类模型的评估指标

指标 含义
准确率 (Accuracy) 预测正确样本数 / 总样本数
精确率 (Precision) 预测为正的样本中,实际为正的比例
召回率 (Recall) 实际为正的样本中,被预测为正的比例
F1值 (F1 Score) 精确率与召回率的调和平均值
ROC曲线 / AUC值 衡量模型区分能力

🧭 五、典型应用场景

  • 📧 邮件分类(垃圾邮件检测)
  • 📷 图像识别(猫狗分类、人脸识别)
  • 💬 文本情感分析(正面/负面)
  • 🏥 医疗诊断(良性/恶性)
  • 💳 信用卡欺诈检测

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/944156.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2025 年连接器厂家最新推荐榜单:聚焦电子 / Type-C / 板对板等品类,精选领军企业助力下游企业精准选型

引言 当前电子产业飞速发展,连接器作为设备信号与电力传输的核心部件,其品质直接决定终端产品稳定性与用户体验。但市场上品牌繁杂、产品质量良莠不齐,部分厂商简化品控导致接触不良、抗干扰弱等问题频发,增加下游…

2025 年干燥机厂家最新推荐排行榜:聚焦闪蒸 / 气流 / 沸腾 / 闭路循环等多类型设备,精选优质企业深度解析

一、干燥机推荐榜推荐一:江苏龙鑫智能干燥科技有限公司推荐指数:★★★★★ 口碑评分:9.9 分 品牌介绍:隶属于龙鑫智能装备产业集群,位于江阴市镇澄路 2600-1 号,是专注干燥设备的专业性系统服务商。注册资本 10…

2025 年北京订制旅游 / 精品旅游 / 旅游包车 / 精品小包团旅游旅行社推荐,北京汇通清源国际旅游公司专业服务解析

行业背景 随着居民消费升级与旅游需求多元化,北京作为历史文化名城与国际旅游目的地,近年来迎来旅游市场新机遇。传统标准化旅游产品已难以满足游客对个性化、深度体验的追求,越来越多旅行者倾向于选择定制化、高品…

具有柔性关节的机械臂MATLAB仿真

柔性关节机械臂MATLAB仿真方案,包含动力学建模、控制器设计和可视化分析。该方案基于拉格朗日方程建立柔性关节模型,并实现了PD控制、滑模控制和自适应控制三种控制策略。 仿真 %% 柔性关节机械臂仿真 - 完整系统 % …

Linux的基本操作值vi操作对与文件

今天学习了vi的基本操作 vi操作分为一般模式,编辑模式,命令行模式。 一般模式: 一般进行光标的移动操作 编辑模式: 一般进行文件的修改: 在一般模式下面点击i按键 进入编辑模式 此刻电脑屏幕不会有显示,但是此刻…

2025 年报警器经销商最新推荐排行榜:深度解析优质服务商,海湾 / 青鸟 / 利达等品牌优选,郑州安创消防实力领衔

引言 当前,安全防护需求持续升级,报警器作为守护生命财产安全的关键设备,市场需求逐年攀升。但报警器经销商市场乱象频发,部分商家以次充好,售卖无认证、性能差的劣质产品,不仅无法发挥预警作用,还埋下严重安全…

连续与间断

连续 \(f(x)\) 在 \(x_0\) 的某一邻域有定义,\(\lim_{\triangle x \rightarrow 0} f(x_0+\triangle x) - f(x_0) = 0\) 左连续 \(\lim_{x\rightarrow x_0^-} f(x) = f(x_0)\) 右连续 \(\lim_{x\rightarrow x_0^+} f(x…

2025 年最新推荐!滑石粉厂家实力排行榜,超细 / 塑料级 / 涂料级 / 造纸级 / 工业级等多类型产品优质企业全解析

引言 当前滑石粉行业供需两端矛盾日益凸显,下游企业采购时频繁遭遇原料品质不稳定、高规格产品供应不足、环保合规风险高、服务响应滞后等问题,严重影响生产效率与产品质量。为精准解决这些痛点,帮助涂料、陶瓷、造…

2025 年最新推荐灭火器维修公司权威榜单:覆盖干粉 / 水基 / 二氧化碳 / 七氟丙烷 / 锂电池灭火器维修,帮您选出专业可靠服务单位

引言 在消防安全保障工作中,灭火器维修质量直接关系到火灾初期能否有效扑救,可当前市场乱象丛生,给用户选择带来极大困扰。部分无资质公司低价竞争,维修后设备存在安全隐患;有些企业技术落后,无法应对不同类型灭…

记一次 .NET 某光放测试系统 崩溃分析

一:背景 1. 讲故事 微信好友里有位朋友找到我,说他部署在windows上的程序,用debug模式正常,但用 release 模式跑程序就崩溃,如果把程序切到 .NET6 的话又都正常,所以很迷茫,让我看看怎么回事,哈哈,这种问题直…

实用指南:题解:AT_abc401_c [ABC401C] K-bonacci

实用指南:题解:AT_abc401_c [ABC401C] K-bonacci2025-10-23 11:44 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; displ…

深入解析:机器学习——聚类算法

深入解析:机器学习——聚类算法pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco&qu…

ASP.NET Core Blazor 路由配置和导航

大家好,我是码农刚子。本文系统介绍了Blazor单页应用的路由机制。主要内容包括:1)基础路由配置,通过@page指令定义URL映射;2)路由参数处理,支持参数约束、可选参数和通配符捕获;3)编程式导航实现,利用Naviga…

session cookie token的区别

核心区别:session是服务器端存储的用户会话数据,cookie是客户端(浏览器)存储的小型文本,token是无状态的身份凭证,通常由客户端携带、服务器验证。存储位置与安全性• Session:存于服务器(内存/数据库),安全…

基于DSP的伺服电机驱动器程序设计

基于DSP的伺服电机驱动器程序设计,结合TMS320F2806芯片特性及工业级实现标准:一、硬件架构设计 1. 核心电路拓扑 DSP(TMS320F2806) ├── PWM模块 → IR2110驱动芯片 → IGBT逆变桥 ├── CAP模块 → 霍尔位置…

cookie和缓存的区别

核心区别:cookie是用于存储用户身份、偏好等小量会话数据的客户端文本文件,而缓存是用于暂存网页资源(如图片、JS)以加速加载的本地存储,二者用途和数据类型完全不同。核心用途• Cookie:核心是“记录用户信息”…

【内网渗透】第168天:基石框架篇单域架构域内应用控制成员组成用户策略信息收集环境搭建

安全级别最高的LAN Area(内网); 安全级别中等的DMZ区域; 安全级别最低的Internet区域(外网)。 三个区域因担负不同的任务而拥有不同的访问策略。 1.内网域 分类:单域、子域、父域、域树、域森林、DNS域名服务器…

2025年常州健身房私教权威推荐榜:专业教练资质与个性化课程服务的口碑之选

2025年常州健身房私教权威推荐榜:专业教练资质与个性化课程服务的口碑之选 在健康意识日益增强的当下,健身行业迎来了前所未有的发展机遇。作为长三角地区的重要城市,常州的健身市场呈现出蓬勃发展的态势。随着消费…

电脑没声音怎么办?4种方法快速修复电脑无声问题(实测有效)

当电脑突然没声音时,很多用户会以为是硬件故障,其实90%以上的情况都能自行修复。本文系统讲解了 电脑没声音的常见原因,并提供了4种实测有效的解决方案——从基础音量设置、硬件连接检查,到声卡驱动更新与系统音频…

易基因:JAR (IF13):西农陈玉林团队多组学分析揭示绵羊早期胚胎发育的分子与表观遗传调控机制|项目文章

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 近日,西北农林科技大学博士后金妙函等为第一作者,陈玉林教授和王小龙教授为通讯作者,在国际知名期刊《Journal of Advanced Research》上发表题为…