人工智能领域【专有名词汇总】...补充中...

🚩 常见的专有名词笔记它来咯! 正在完善每一项的内容ing…
🚩 版本号:V1.0


文章目录

  • 1. 学习范式类
    • 1.1 监督学习(Supervised Learning)
    • 1.2 无监督学习(Unsupervised Learning)
    • 1.3 自监督学习(Self-Supervised Learning, SSL)
    • 1.4 半监督学习(Semi-Supervised Learning)
    • 1.5 弱监督学习(Weakly Supervised Learning)
    • 1.6 多实例学习(Multiple Instance Learning, MIL)
    • 1.7 元学习(Meta-Learning)
    • 1.8 联邦学习(Federated Learning)
  • 2. 表征与预训练
    • 2.1 表征学习(Representation Learning)
    • 2.2 特征学习(Feature Learning)
    • 2.3 预训练(Pretraining)
    • 2.4 微调(Fine-tuning)
  • 3. 对比学习
    • 3.1 对比学习(Contrastive Learning)
    • 3.2 正样本 / 负样本(Positive / Negative Samples)
    • 3.3 数据增强(Data Augmentation)
    • 3.4 表征坍塌(Representation Collapse)
  • 4. 生成式
    • 4.1 掩码(Mask)
    • 4.2 自动编码器(Autoencoder)
    • 4.3 变分自动编码器(Variational Autoencoder, VAE)
    • 4.4 自回归(Autoregressive)
  • 5. 迁移与泛化
    • 5.1 迁移学习(Transfer Learning)
    • 5.2 域泛化(Domain Generalization)
    • 5.3 域自适应(Domain Adaptation)
    • 5.4 过拟合(Overfitting)
    • 5.5 欠拟合(Underfitting)
  • 6. 多模态
    • 6.1 多模态学习(Multimodal Learning)
    • 6.2 跨模态对齐(Cross-modal Alignment)
    • 6.3 表征解耦(Representation Disentanglement)
  • 7. 深度学习组件
    • 7.1 卷积神经网络(CNN)
    • 7.2 循环神经网络(RNN)
    • 7.3 长短期记忆网络(Long Short-Term Memory, LSTM)
    • 7.4 门控循环单元(GRU)
    • 7.5 Transformer
    • 7.6 注意力机制(Attention Mechanism)
    • 7.7 自注意力(Self-Attention)
    • 7.8 多头注意力(Multi-Head Attention)
    • 7.9 生成对抗网络(Generative Adversarial Network, GAN)
    • 7.10 扩散模型(Diffusion)
  • 8. 自然语言处理(NLP)
    • 8.1 词嵌入(Word Embedding)
    • 8.2 词袋模型(Bag-of-Words, BoW)
    • 8.3 语言模型(Language Model, LM)
    • 8.4 掩码语言模型(Masked Language Model, MLM)
    • 8.5 因果语言模型(Causal Language Model, CLM)
    • 8.6 零样本学习(Zero-Shot Learning)
    • 8.7 少样本学习(Few-Shot Learning)
  • 9. 计算机视觉(CV)
    • 9.1 卷积(Convolution)
    • 9.2 池化(Pooling)
    • 9.3 特征图(Feature Map)
    • 9.4 目标检测(Object Detection)
    • 9.5 图像分割(Image Segmentation)
    • 9.6 图像生成(Image Generation)
    • 9.7 迁移表征(Transferred Representation)
    • 9.8 数据增强(Data Augmentation)
  • 10. 模型训练与优化
    • 10.1 损失函数(Loss Function)
    • 10.2 优化器(Optimizer)
    • 10.3 反向传播(Backpropagation)
    • 10.4 梯度下降(Gradient Descent)
    • 10.5 学习率(Learning Rate)
    • 10.6 批大小(Batch Size)
    • 10.7 正则化(Regularization)
    • 10.8 归一化(Normalization)
    • 10.9 早停(Early Stopping)

1. 学习范式类

1.1 监督学习(Supervised Learning)

  • 定义人工标注,训练数据包含明确的“输入-输出”标签(Label)
  • 优点:目标明确、收敛稳定、效果通常最好(同分布+标注充分时)。
  • 缺点:标注昂贵;对分布偏移敏感;标签噪声会显著影响上限。
  • 典型场景:目标检测、语义分割、分类、关键点。

1.2 无监督学习(Unsupervised Learning)

  • 定义没有人工标签,目标是发现数据的结构/分布
  • 优点:不需要标注,数据规模往往更大;可用于探索性分析。
  • 缺点:目标通常不直接对应下游任务;评价指标不统一。
  • 典型场景:聚类、降维、异常检测、学习数据分布。

1.3 自监督学习(Self-Supervised Learning, SSL)

  • 定义不依赖人工标签,但从数据自身构造监督信号(伪标签/预任务)来学习表征;形式上仍是“监督训练”。
  • 优点:不需要标注,数据规模往往更大,利用海量无标注数据学习通用特征。
  • 缺点:目标通常不直接对应下游任务;需大规模计算资源,伪标签可能含噪声。
  • 典型场景:通用表征学习、多模态理解、对比学习、掩码建模。

1.4 半监督学习(Semi-Supervised Learning)

  • 定义:同时使用少量人工标注数据和大量无标注数据进行训练。
  • 优点:减少标注成本,借助无标注数据改善模型泛化。
  • 缺点:对无标注数据质量敏感。
  • 典型场景:标注成本高、数据量大的任务。

1.5 弱监督学习(Weakly Supervised Learning)

  • 定义:使用不完整、不精确或不确切的人工标注信号,非全监督的精细标注,也非半监督学习采用的大量无标注数据。
  • 优点:减少标注成本,借助无标注数据改善模型泛化。
  • 缺点:监督信号存在歧义或噪声,性能通常低于全监督学习。
  • 典型场景:标注成本高、数据量大的任务。

1.6 多实例学习(Multiple Instance Learning, MIL)

  • 定义:标签作用于“包”(bag)而非单个实例,一个包由多个实例组成;bag 有标签,但 bag 内每个实例没有标签
  • 优点:显著降低标注成本;能从粗粒度标签中学习细粒度特征。
  • 缺点:学习目标间接,实例与包的关系复杂,易出现歧义。
  • 典型场景:适用于实例级标注困难但包级标注可行的场景。

1.7 元学习(Meta-Learning)

  • “学会学习”,快速适应新任务。

1.8 联邦学习(Federated Learning)

  • 多方协作训练模型但不共享原始数据。

2. 表征与预训练

2.1 表征学习(Representation Learning)

  • 自动学习对下游任务有用的特征表示,而非人工设计特征。
  • 不是直接做任务输出,而是学“中间表示”——embedding/feature
  • 多采用自监督学习,少量采用可监督学习

2.2 特征学习(Feature Learning)

  • 表征学习的早期说法,强调从数据中学习特征而不是手工提取。

2.3 预训练(Pretraining)

  • 在大规模数据上先训练通用模型,再迁移到具体任务。
  • 监督预训练:ImageNet 分类预训练
  • 自监督预训练:SimCLR/MAE/CLIP 式预训练
  • 多模态预训练:图文对齐、语音-文本等

2.4 微调(Fine-tuning)

  • 在预训练模型基础上,用下游任务数据进一步训练模型参数。
  • 全量微调:更新全部参数
  • 冻结骨干:只训练 head 或部分层(省算力、避免过拟合)
  • 参数高效微调(PEFT):只训练少量新增参数(LoRA、Adapter,更多见于大模型)

3. 对比学习

3.1 对比学习(Contrastive Learning)

  • 通过拉近正样本、拉远负样本来学习判别性表示。
  • 常用损失:InfoNCE(基于 softmax 的对比损失)
  • 关键要素:增强策略、负样本数量/质量、温度系数、投影头(projection head)
  • 代表方法:SimCLR(大 batch)、MoCo(动量编码器+队列)、SupCon(有监督对比)

3.2 正样本 / 负样本(Positive / Negative Samples)

  • 通过“相似性学习”让正样本更近、负样本更远。

  • 假负样本(False Negative):负样本其实语义相同,会误导训练。

  • 难负样本(Hard Negative):相似但不同,能提高判别性但也更不稳定。

3.3 数据增强(Data Augmentation)

  • 对输入施加可控变换,生成不同视图,提高鲁棒性或构造自监督信号。
  • 常见增强(CV):随机裁剪、翻转、颜色抖动、模糊、灰度化、Cutout/Mixup/CutMix。

3.4 表征坍塌(Representation Collapse)

  • 模型输出退化为常数向量,失去区分能力,是自监督训练的重要风险。

避免思路:

  • 显式负样本(对比学习)

  • 结构非对称(predictor、stop-gradient)

  • 方差/协方差正则(VICReg、Barlow Twins)

  • 合理的归一化与 batch 设置

4. 生成式

4.1 掩码(Mask)

  • 随机遮挡部分输入,让模型预测被遮挡内容,如 BERT、MAE。

4.2 自动编码器(Autoencoder)

  • 通过编码–解码重建输入数据来学习低维表示。

4.3 变分自动编码器(Variational Autoencoder, VAE)

  • 在概率空间中学习数据分布的生成模型,具有连续潜空间。

4.4 自回归(Autoregressive)

  • 基于历史信息逐步预测未来内容,如语言模型、时间序列建模。

5. 迁移与泛化

5.1 迁移学习(Transfer Learning)

  • 将一个任务中学到的知识迁移到另一个相关任务。

5.2 域泛化(Domain Generalization)

  • 在未见过的新数据分布上仍能保持性能。

5.3 域自适应(Domain Adaptation)

  • 在源域有标签、目标域无或少标签的情况下适配模型。

5.4 过拟合(Overfitting)

  • 模型在训练集表现很好但在测试集表现差。

5.5 欠拟合(Underfitting)

  • ​模型在训练集和测试集均表现不佳,未能捕捉数据规律。

6. 多模态

6.1 多模态学习(Multimodal Learning)

  • 联合建模图像、文本、语音等多种模态信息。

6.2 跨模态对齐(Cross-modal Alignment)

  • 将不同模态映射到同一语义空间,实现语义一致性。

6.3 表征解耦(Representation Disentanglement)

  • 将不同因素(外观、运动、语义)分离建模,提升可解释性和鲁棒性。

7. 深度学习组件

7.1 卷积神经网络(CNN)

  • 擅长处理图像的网络结构。

7.2 循环神经网络(RNN)

  • 处理序列数据的网络结构。

7.3 长短期记忆网络(Long Short-Term Memory, LSTM)

  • 改进型 RNN,解决长程依赖问题。

7.4 门控循环单元(GRU)

  • 简化的 LSTM,计算效率更高。

7.5 Transformer

  • 基于自注意力机制的序列/多模态模型架构。

7.6 注意力机制(Attention Mechanism)

  • 动态加权关注输入的不同部分。

7.7 自注意力(Self-Attention)

  • 输入内部各位置相互计算相关性。

7.8 多头注意力(Multi-Head Attention)

  • 并行多个注意力头捕获不同特征子空间。

7.9 生成对抗网络(Generative Adversarial Network, GAN)

  • 生成器与判别器对抗训练的模型。

7.10 扩散模型(Diffusion)

  • 通过逐步去噪生成数据的模型。

8. 自然语言处理(NLP)

8.1 词嵌入(Word Embedding)

  • 将词语映射为低维向量(如 Word2Vec)。

8.2 词袋模型(Bag-of-Words, BoW)

  • 忽略词序的文本表示方法。

8.3 语言模型(Language Model, LM)

  • 预测词序列概率分布的模型。

8.4 掩码语言模型(Masked Language Model, MLM)

  • 随机遮盖词并预测(如 BERT)。

8.5 因果语言模型(Causal Language Model, CLM)

  • 从左到右预测下一个词(如 GPT)。

8.6 零样本学习(Zero-Shot Learning)

  • 模型在未见过的类别上直接推理。

8.7 少样本学习(Few-Shot Learning)

  • 用极少标注样本适应新任务。

9. 计算机视觉(CV)

9.1 卷积(Convolution)

  • 提取局部特征的运算。

9.2 池化(Pooling)

  • 降采样减少参数量(如 Max Pooling)。

9.3 特征图(Feature Map)

  • 卷积层输出的二维激活图。

9.4 目标检测(Object Detection)

  • 定位并分类图像中的物体。

9.5 图像分割(Image Segmentation)

  • 像素级别的分类(语义/实例分割)。

9.6 图像生成(Image Generation)

  • 生成逼真图像(GAN/扩散模型)。

9.7 迁移表征(Transferred Representation)

  • 从预训练模型中提取的通用视觉特征。

9.8 数据增强(Data Augmentation)

  • 通过旋转、裁剪等方式扩充训练数据。

10. 模型训练与优化

10.1 损失函数(Loss Function)

  • 衡量预测与真实值差距的函数。

10.2 优化器(Optimizer)

  • 更新模型参数的算法(如 SGD、Adam)。

10.3 反向传播(Backpropagation)

  • 计算梯度的链式法则算法。

10.4 梯度下降(Gradient Descent)

  • 沿梯度反方向更新参数以最小化损失。

10.5 学习率(Learning Rate)

  • 参数更新步长的系数。

10.6 批大小(Batch Size)

  • 一次参数更新使用的样本数量。

10.7 正则化(Regularization)

  • 防止过拟合(如 L1/L2、Dropout)。

10.8 归一化(Normalization)

  • 调整数据/特征分布(如 BatchNorm、LayerNorm)。

10.9 早停(Early Stopping)

  • 验证集性能不再提升时提前终止训练。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1069016.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

科立干冰清洗机:,靠谱之选 - 工业品网

在工业清洗领域,科立干冰清洗机凭借其卓越的性能和可靠的品质,成为众多企业的。那么,科立干冰机的市场竞争力强吗?科立干冰清洗机好不好?其使用寿命长吗?让我们一同深入了解。 市场竞争力强劲,凸显行业优势 当前…

不止溜背好看,这辆新奥迪还藏着“华为大脑”

近日,奥迪A5L Sportback旗舰版开启了正式交付。据悉,该车一共有两款配置,价格为34.59万元与38.29万元。如果你对这车还不太熟,那就对了。因为该车和印象里的奥迪确实有些不一样,尤其是它“脑袋”里装的东西。近日…

对比学习:【SimCLR】

🚩 对比学习最经典的框架:SimCLR 笔记它来咯! 主要包括:数据增强 编码 投影头 对比损失 文章目录1. 一句话概括2. 简介2.1 模型定位2.2 历史意义2.3 核心思想3. 方法3.1 数据增强(Data Augmentation)3.2…

智谱MiniMax竞速上市,字节新模型数学推理突破,清华开源视频生成技术,AI监管政策出台

今天AI领域有多项重要进展,涵盖大模型商业化、技术突破、政策监管、芯片竞争等多个方面。本文将重点关注大模型创业公司竞速上市、字节在AI推理能力上的突破、AI视频生成技术的普及、AI监管政策的出台等核心要点。 1.…

全新帕萨特ePro前瞻:换了新平台、综合续航1300公里

12月23日,有国内媒体消息曝光了上汽大众帕萨特ePro的上市时间,该车此前在广州车展已经亮相,预计2026年会正式上市。 外观设计走科技风,尺寸挺能“装”新车的样子和现在大众的风格不太一样,其采用了贯穿式LED灯带和…

ADXL345加速度传感器原理图设计,已量产(加速度传感器)

目录 1、ADXL345 核心电路:引脚与通信的 “隐形规则” 2、电源系统:LDO 的 “滤波 CP 组合” 3、I2C 接口:上拉电阻的 “黄金值” 4、实际调试的 “避坑点” 在嵌入式项目里,ADXL345 这种小体积、低功耗的加速度传感器出镜率很高 —— 不管是做运动检测还是倾角测量,它…

Java毕设选题推荐:基于Springboot+Vue的旅游攻略分享平台系统基于VUE的旅游信息分享管理平台【附源码、mysql、文档、调试+代码讲解+全bao等】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

对比学习2:【MoCo】

🚩 SimCLR 模型进阶版—— MoCo模型 笔记它来咯! 何凯明大佬之作。创新之处:1. 一个样本与多个样本一同对比; 2. 采用动量更新,即:指数滑动平均(EMA) 文章目录1. 一句话概括2. 创新点3. 具体方法…

分段存储管理方式学习总结

分段存储管理方式不会产生内部碎片,但其会产生外部碎片(与动态分区分配同理)。在该分配方式中,程序按照自身的逻辑关系划分为若干个段,操作系统以段为单位为这些段分配内存空间,这些段之间可以不相邻。 在程序的逻…

浅析为什么要用Cursor Commands及在日常开发中如何使用的最佳实践

一句话总结:Cursor Commands = 把常用的 AI 提示词变成可复用、可分享、可管理的快捷命令。核心价值:提效 + 标准化 + 团队协作。官方文档:https://cursor.com/cn/docs/agent/chat/commands 一、Cursor Commands 1、…

科立干冰清洗机:研发实力、口碑售后解析 - 工业设备

在工业清洗领域,干冰清洗机正逐渐成为企业的新宠。而宁波科立干冰科技有限责任公司的干冰清洗机,更是凭借卓越的研发能力、良好的口碑和优质的售后,在市场上脱颖而出。那么,科立干冰清洗机的研发能力究竟有多强?口…

5、索引的数据结构(b+树,hash)

索引的数据结构(b树,hash) 索引的数据结构和具体存储引擎的实现有关,在MySQL中使用较多的索引有Hash索引,B树索引等,而我们经常使用的InnoDB存储引擎的默认索引实现为:B树索引。 对于哈希索引…

毕业项目推荐:87-基于yolov8/yolov5/yolo11的血红细胞检测计数系统(Python+卷积神经网络)

文章目录项目介绍大全(可点击查看,不定时更新中)概要一、整体资源介绍技术要点功能展示:功能1 支持单张图片识别功能2 支持遍历文件夹识别功能3 支持识别视频文件功能4 支持摄像头识别功能5 支持结果文件导出(xls格式&…

元推理框架一次完美的“框架内机器证明”:对莱布尼茨级数的解析

ECT-OS-JiuHuaShan/https://orcid.org/0009-0006-8591-1891“元推理框架的神奇之处在于,尽管去问框架的所有问题,除了核心公理公式,都可以提供。” 这已不是理论宣言,而是一个 功能性的完整承诺。它宣告框架是一个…

2025.12.25

两节课,跆拳道考试第二名🥈,满意,回宿舍吃饭,睡一下午

高德地图红绿灯倒计时之实现原理

概述 相信大家在开车导航时都注意到了,高德地图(以及其他导航软件)现在能在路口精准地显示红绿灯的倒计时,甚至还能告诉你“需要等待 2 轮红灯”。 很多人第一反应是:“高德是不是接入了交警的红绿灯后台数据?”…

6、索引算法有哪些?

索引算法有哪些&#xff1f;索引算法有 BTree算法和Hash算法BTree算法BTree是最常用的mysql数据库索引算法&#xff0c;也是mysql默认的算法。因为它不仅可以被用在,>,>,<,<和between这些比较操作符上&#xff0c;而且还可以用于like操作符&#xff0c;只要它的查询…

根据日期编码

根据日期编码aardio练习题之一 在给项目命名的时候,有时候为了编码会纠结半天。 做了这个五位数的编码也好记。 这个是aardio(webview2),纯html+css+javascript,没有第三方框架。 网盘地址:蓝奏云 密码

毕业项目推荐:88-基于yolov8/yolov5/yolo11的昆虫检测识别系统(Python+卷积神经网络)

文章目录项目介绍大全&#xff08;可点击查看&#xff0c;不定时更新中&#xff09;概要一、整体资源介绍技术要点功能展示&#xff1a;功能1 支持单张图片识别功能2 支持遍历文件夹识别功能3 支持识别视频文件功能4 支持摄像头识别功能5 支持结果文件导出&#xff08;xls格式&…

游戏手柄电池选购指南:品牌、价格与充电方式全解析 - 工业品网

在当今数字化娱乐时代,游戏手柄已成为玩家们不可或缺的装备。而一款好用的游戏手柄电池,更是保障游戏体验的关键因素。那么,游戏手柄电池有哪些行业优势和特点?市场上又有哪些口碑好的品牌?价格如何?充电方式有哪…