一文读懂监督、无监督、自监督与半监督学习:小白到大模型必备知识

文章系统介绍机器学习的四大范式:监督学习依赖标注数据训练模型;无监督学习挖掘数据内在特征完成任务;半监督学习结合少量标注和大量无标签数据提升性能;自监督学习通过设计辅助任务从无标签数据中生成监督信号。这些方法各有特点和应用场景,其中自监督学习在大模型预训练中表现尤为突出,能学习到泛化性强的特征表示,为下游任务提供有力支持。


监督学习

监督学习利用大量的标注数据来训练模型,对模型的预测值和数据的真实标签计算损失,然后将误差进行反向传播(计算梯度、更新参数),通过不断的学习,最终可以获得识别新样本的能力。

  • **特点:**每个样本都有明确标签(如图片分类中的“猫/狗”)

  • **典型应用:**图像分类、语音识别、垃圾邮件过滤。

  • **局限性:**标注成本高,数据标注耗时且依赖人工

无监督学习

无监督学习完全无需人工标注,通过对数据内在特征的挖掘,找到样本间的关系。

  • **特点:**数据本身蕴含结构(如客户分群、文本主题提取)

与有监督学习的最主要差别:是否需要人工标注的标签信息

真正的无监督学习应该不需要任何标注信息,通过挖掘数据本身蕴含的结构或特征,来完成相关任务,大体可以包含三类:

聚类k-means,谱聚类等
降维线性降维:PCA、ICA、LDA、CCA等
非线性降维:ISOMAP、KernelPCA等
2D降维:2D-PCA
离散点检测如基于高斯分布或多元高斯分布的异常检测算法

无监督学习最主要采用的是自动编码器的方式。

其核心机制是通过编码器-解码器结构实现数据压缩与重构:

**编码阶段:**编码器将输入数据(如图像、文本)压缩为低维隐层向量,保留关键特征;

解码阶段:解码器基于隐层向量重建原始数据,理论上能无损还原输入。

由于隐层维度远低于输入维度(例如将784维图像压缩至20维),这个过程本质是非线性降维。

学习到的隐层向量可作为数据的紧凑表征,直接替代原始数据用于聚类、分类等任务,降低计算复杂度。(例如MNIST手写体识别中,150维隐层即可有效区分数字类别)

**表征/表示学习(Representation Learning)**则是对如何学习隐藏向量的研究。

  • 核心是让机器自动从数据中提取有用特征(比如把图片压缩成几串数字)。

传统方法(如自动编码器)虽然能压缩数据,但存在两个关键问题:

1、只看像素,忽略结构

传统方法按像素逐个重建(比如把猫的每根毛都单独处理),导致模型学不到“猫耳朵”和“猫脸”的关联,只能记住零散的像素点。

2、语义信息缺失

比如判断两张图是否都是“猫”,传统方法可能只关注颜色深浅,而无法识别“胡须方向”等关键特征。

自监督学习通过设计辅助任务(如预测图片旋转角度、拼图还原),迫使模型理解数据背后的逻辑,最终学到“猫有四条腿”这样的语义知识。

半监督学习

**半监督学习:**让学习器不依赖外界交互,自动的利用未标记样本来提升学习性能。

  • **核心思想:**结合少量标注数据和大量无标签数据,提升模型性能。

半监督学习可进一步划分为纯(pure)半监督学习直推学习(transductive learning),

纯(pure)半监督学习假定训练数据中的未标记样本并非待测的数据
直推学习(transductive learning)假定学习过程中所考虑的未标记样本是待预测数据,学习的目的就是在这些未标记样本上获得最优泛化性能。

半监督深度学习算法可以总结为三类:

1. 无标签数据预训练网络后有标签数据微调(fine-tune)

**无监督打地基:**用所有数据逐层重构预训练,对网络的每一层,都做重构自编码,保留核心特征,然后把自编码网络的参数,作为初始参数,用有标签数据微调。

**伪有监督预训练:**通过某种方式/算法(如半监督算法,聚类算法等),用少量标记数据微调模型,提升分类能力,然后在用有标签数据来微调。

例子:先用10万张无标签图片训练特征提取器,再用1万张带标签图片优化细节

2. 利用从网络得到的深度特征来做半监督算法

先用有标签数据训练网络,从网络中提取数据特征,以这些特征用某种分类算法对无标签数据进行分类,挑选认为分类正确的无标签数据加入到训练集,再训练网络,如此循环。

  • **特点:**筛选高置信度预测结果 → 加入训练集循环优化
  • **效果:**像滚雪球,正确分类的无标签数据越多,模型越强

3. 半监督网络结构

就神经网络本身而言,其实还是运行在一种有监督的方式上。2015年诞生半监督ladderNet,效果非常好,达到了当时的state-of-the-art性能。

文章

(Rasmus,A.,Valpola,H.,Honkala,M.,Berglund,M.&Raiko,T. Semi-Supervised Learning with Ladder Network.)

ladderNet是有监督算法和无监督算法的有机结合。

很多半监督深度学习算法是用无监督预训练这种方式对无标签数据进行利用的,但事实上,这种把无监督学习强加在有监督学习上的方式有缺点:

  • **传统问题:**自监督预训练(学特征)和监督微调(学分类)目标冲突

ladderNet通过skip connection解决这个问题,通过在每层的编码器和解码器之间添加跳跃连接(skip connection),减轻模型较高层表示细节的压力,使得无监督学习和有监督学习能结合在一起,并在最高层添加分类器,ladderNet就变身成一个半监督模型。

  • **优势:**同时利用标记数据分类+未标记数据重建,提升泛化能力

自监督学习

相比于上述方法,自监督学习实现了用更少的样本或更少的实验来学习更多

  • 核心思想:通过设计辅助任务(如预测图像旋转角度),从无标签数据中生成监督信号

自监督学习在很多地方被定义为无监督学习问题,但是它常常被构造为监督学习问题的求解形式

典型的例如word2vec,autoencoder这类明明没标签却能够造出目标函数,使用凸优化方法求解,无中生有,这和kmeans,dbscan之类的无监督学习的范式是完全不同的

判断一个工作是否属于自监督学习,除了无需人工标注这个标准之外,还有一个重要标准,就是是否学到了新的知识。对于自监督学习能够学到新信息的原理解释:

  1. 数据的丰富性和多样性:

    自监督学习通常利用大规模的未标记数据进行训练,这些数据往往具有丰富的内容和多样的特征。

  2. 任务的设计和构造:

    通过设计具有挑战性和信息丰富度的预测任务,可以促使模型更好地学习数据的表示。例如,可以设计预测图像的旋转角度、颜色变换、上下文信息等任务。

  3. 迁移学习和泛化能力:

    通过对比学习、时序建模等方法,提取跨领域通用特征(如物体轮廓、语义关联),实现小样本场景下的快速适应与持续学习。

  4. 自适应和增量学习:

    可以通过不断更新模型参数来适应新的数据和环境。

  5. 特征提取和表示学习:

    自监督学习通过预测数据的属性或结构,推动模型学习数据的特征表示。些特征表示可以用于解决各种任务。

自监督学习通过设计数据增强和任务构造,从无标签数据中自动生成监督信号:

  1. **数据增强:**对图片翻转、裁剪等操作生成新样本,迫使模型学习不变特征(如识别旋转后的猫)。
  2. 图像任务

像素预测:遮挡部分图像,让模型补全(如MAE)

颜色化:将灰度图恢复彩色,学习语义关联(如天空蓝色)

**3.对比学习:**对同一图片生成不同增强视图(如裁剪+调色),拉近相似视图的特征距离,推开不相似视图

**4.生成式任务:**用GAN生成假图,与原图对比学习特征(如StyleGAN)

实际上自监督学习的应用有很多,但是其最核心的目标还是在**“为下游的有监督任务学习良好的representation”**,

通过自监督学习能够学习到泛化性能很强的representation(也即nn里的一些layer输出的features是比较generalized,这个generalized的features反应了数据本身的一些隐藏的pattern,最好这些pattern可以在许多的下游任务中shared(transfer learning and pretrained model)),

例如nlp中的许多预训练任务都可以视为自监督学习,从transformer pretrained model的表现也可以看到自监督学习的强大。

优势:

  • 无需人工标注,数据利用率高。
  • 学习的特征泛化性强,适合小样本场景。

典型应用:

  • 大语言模型预训练(如GPT、BERT)
  • 图像自监督表征学习(如ResNet)
  • 多模态任务(如CLIP跨模态对齐)

如何学习AI大模型?

如果你对AI大模型入门感兴趣,那么你需要的话可以点击这里大模型重磅福利:入门进阶全套104G学习资源包免费分享!

这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

这是一份大模型从零基础到进阶的学习路线大纲全览,小伙伴们记得点个收藏!


第一阶段:从大模型系统设计入手,讲解大模型的主要方法;

第二阶段:在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段:大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段:大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段:大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段:以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段:以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

100套AI大模型商业化落地方案

大模型全套视频教程

200本大模型PDF书籍

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

LLM面试题合集

大模型产品经理资源合集

大模型项目实战合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1125585.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

10. 同局域网内远程控制另一台电脑

目标: 两台 Windows 家庭版笔记本,在同一 Wi-Fi 下,用 RustDesk 局域网远控 ✅ 不走公网 ✅ 不依赖官方服务器 ✅ 延迟接近本地 ✅ 可扩展到自建服务器一、RustDesk 的“通信模型” 先知道 RustDesk 到底是怎么连的,否则你不知道什…

大模型开发收藏级指南:为什么资深开发者建议先跳过Dify和LangChain?

文章指出,在快速迭代的AI领域,框架往往"约束"大于"赋能"。真正掌握LLM开发应先通过Python调用原生API,以获得更高透明度、更好调试体验和更快适配新特性。建议采用渐进式开发路径:先通过原生API理解基础&…

深度学习毕设选题推荐:基于python-CNN的水果识别基于python的水果识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

由continue引发的一个debug灾难

整个代码的简化逻辑是这样的,由于continue的使用含义不清楚,导致debug了半天。这里写代码时,错误的将continue认为是else分支,什么也不干,往下继续执行。 但是这样的理解是极其错误的,continue的意思是跳过…

AI 开源知识库大战:WeKnora、RAGFlow、FastGPT、FlashRAG,谁更厉害

我看大家对目前的开源RAG知识库都挺感兴趣的,就像来对比一下目前比较流行的几个知识库,看看哪个更适合你,哪个更有钱途,哈哈。 其实真要搭过这几个知识库,就会发现:每个用到的地方,还真不一样&a…

Thinkphp和Laravel框架的网上购书图书销售商城系统网站的设计与实现_55ap4swk

目录系统设计背景技术架构功能模块性能与安全总结项目开发技术介绍PHP核心代码部分展示系统结论源码获取/同行可拿货,招校园代理系统设计背景 ThinkPHP和Laravel作为国内流行的PHP框架,分别以高效开发与优雅设计著称。网上购书商城系统基于两者实现,旨在…

计算机深度学习毕设实战-基于python的水果识别基于python-CNN的水果识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

Vue 3 中,unmounted 生命周期钩子会在组件实例被销毁并从 DOM 中移除后调用

Vue3中unmounted钩子在组件销毁时触发,常见场景包括:v-if条件变化;动态组件切换;路由导航;v-for列表更新;父组件卸载;手动调用unmount();Teleport目标移除;组合式API停止…

校平机:金属板材的“应力整形术“

基本原理:消除内应力的力学博弈 校平机是通过塑性弯曲变形来消除金属板材内部残余应力的设备。金属在轧制、切割或热处理后,内部应力分布不均会导致宏观不平整。校平机利用多组交错排列的辊系,使板材经历多次小曲率的正反弯曲,迫…

学习收藏】零门槛上手Ollama:本地大模型部署与实战体验分享

文章详细介绍了本地大模型工具Ollama的安装与使用方法,涵盖Windows和Linux(wsl2)两种环境。作者通过实际测试体验了不同模型的功能,指出本地模型虽功能不及云端大模型,但能满足基本需求且保护隐私。Ollama还提供cloud版本,解决了本…

Linux环境下Tomcat的安装与配置详细指南

Apache Tomcat是一个广泛使用的开源Java Servlet容器和Web服务器,适用于运行Java Web应用程序。本指南将详细介绍如何在Linux环境中安装和配置Tomcat,包括必要的前提条件、下载安装、配置环境变量、设置为系统服务以及基本的安全配置。 目录 前提条件安…

程序员必学!大模型产品经理入门指南(附7阶段学习路线+年薪80万转型案例)

大模型产品经理在2025年迎来黄金发展期,薪资涨幅超50%,一线城市资深年薪突破80万。相比程序员,产品经理凭借场景挖掘、资源整合和产品设计能力可直接切入。文章详解了5大核心能力模型和7阶段学习路线,从认知筑基到实战应用&#x…

Linux系统安装部署Tomcat

1、进入Tomcat官网,官网地址:https://tomcat.apache.org/ 2、点击左侧Download下的Archives按钮 3、选择需要下载的版本 下载地址:https://archive.apache.org/dist/tomcat/ 4、点击自己需要下载的版本,我这里下载的是9.0.6 5、…

AirCloud平台与excloud扩展库协同实战:核心功能落地案例!

在边缘智能与云边协同日益融合的今天,AirCloud平台以其出色的设备管理与资源调度能力脱颖而出,而excloud扩展库则为平台注入了灵活的功能扩展机制。二者的协同应用,为复杂业务场景提供了强有力的支撑。但如何通过合理配置实现功能最大化&…

uvm_config_db机制学习

1. 当uvm_config_db传递一个类的句柄时,传递的是这个句柄,如果有组件在后续的phase中,改变了对象的值,那么其他组件也能感知到这个对象的值发生了变化并不是在build_phase阶段,这个句柄被set了之后,值就不会…

Linux系统下安装配置 Nginx 超详细图文教程_linux安装nginx

#安装当前路径下所有安装包 rpm -Uvh *.rpm --nodeps --force2.2、安装Nginx 找到Nginx的安装包进行解压 #解压安装包 tar -zxvf nginx-1.24.0.tar.gz进入解压之后的nginx目录下: #进入nginx目录 cd /usr/local/nginx-1.24.0执行配置脚本,–prefix是指定…

基于STM32的果蔬保鲜系统设计

基于STM32的果蔬保鲜系统设计摘要随着果蔬产业的迅速发展,食品保鲜要求日益增高,研究表明控制保鲜库温湿度恒定和二氧化碳的浓度稳定对延长果蔬存储时间有显著促进作用。在果蔬保鲜过程中,对温湿度、二氧化碳浓度等参数的实时准确采集和检测是…

调研了一下大模型知识蒸馏方向近几年的一些工作

概述 知识蒸馏的目的是将知识从大型复杂模型转移到更小更高效的模型中。 按照实现类型,大体可分为两种: 黑盒蒸馏(Black-box):学生模型仅可访问教师模型的输入和输出白盒蒸馏(White-box)&#x…

深度学习计算机毕设之机器学习基于python-CNN的水果识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

一、CS反恐精英AMXX插件安装(附带安装包)

本期内容讲CS反恐精英安装AMXX(AMX Mod X)插件,是一个扩展工具,核心是自定义游戏规则、添加玩法以及管理服务器秩序的工具。最为常见的死亡竞赛、生化模式等这些都是需要依赖AMXX才得以实现,默认版本下是不带有该插件的,需要自己来去安装,当然也有一些版本已经安装好了,…