【Machine Learning Q and AI 读书笔记】- 02 自监督学习

Machine Learning Q and AI 中文译名 大模型技术30讲,主要总结了大模型相关的技术要点,结合学术和工程化,对LLM从业者来说,是一份非常好的学习实践技术地图.

本文是Machine Learning Q and AI 读书笔记的第2篇,对应原书第二章 《自监督学习》.


TL;DR

本文着重围绕3个问题:

  1. 什么是自监督学习;
  2. 自监督学习在哪些情况下有效;
  3. 自监督学习的实现方法有哪些.

什么是自监督学习

Self-supervised learning is a pretraining procedure that lets neural networks leverage large unlabeled datasets in a supervised fashion.

从原文可以看到,自监督学习是一个预训练过程, 能让神经网络在监督学习的方式下,学习大规模的无标签数据集.

因为自监督学习和迁移学习有相关性,因此先介绍一下迁移学习(Transfer Learning)的概念。

迁移学习

tl

Transfer learning (TL) is a technique in machine learning (ML) in which knowledge learned from a task is re-used in order to boost performance on a related task. For example, for image classification, knowledge gained while learning to recognize cars could be applied when trying to recognize trucks. This topic is related to the psychological literature on transfer of learning, although practical ties between the two fields are limited. Reusing/transferring information from previously learned tasks to new tasks has the potential to significantly improve learning efficiency

from wiki

迁移学习(Transfer Learning,TL)是机器学习(Machine Learning,ML)中的一种技术,它将从一个任务中获得的知识重新用于提升在相关任务上的性能。例如,在图像分类中,学习识别汽车时获得的知识可以应用于识别卡车。这一主题与心理学中关于学习迁移的文献相关,尽管这两个领域之间的实际联系是有限的。从先前学习的任务中重用/转移信息,有可能显著提高学习效率。

自监督学习

自监督学习是迁移学习的一种替代方案,区别在于,迁移学习是在有标签数据集上,而自监督学习在无标签数据集上.

self supervised learning
自监督学习的一个例子是NLP任务中预测缺失词,这和BERT的完形填空式训练任务基本一致. 方法是把句子中的某个词语替换成[MASK] 标签让模型去预测.

什么场景下有效

文中提到,迁移学习和自监督学习的主要区别在于如何获取标签. 在迁移学习中,假设所有的数据都有标签并且这些标签大多是由人工标注. 在自监督学习中,标签是从数据中直接获取的。例如LLM的预训练,就是直接输入语料(严格来说,也是把语料拆分为输入和标签,只不过标签本身来自于语料).

那么,这里可以回答开头的第二个问题,什么场景下有效,就是无标签数据集下.

实现方式

这里谈到实现方式,是在说训练的下游任务.

文中提到两种类型的任务:

  • 自预测
  • 对比自监督

自预测

In self-prediction, we typically change or hide parts of the input and train the model to reconstruct the original inputs.

在自预测中,我们通常会更改或隐藏输入的一部分,并训练模型重建原始输入。

文中的例子:
masked
这里通过掩盖输入图片中的一部分让模型去预测,达到自预测的训练目标.

对比自监督

对比自监督任务中,则是训练神经网络学习一个嵌入空间,其中,相似的输入彼此接近,而不相似的输入则距离远。 也就是网络能产生的嵌入向量能够满足相似样本间向量距离近,不相似的距离远.

对比自监督


总结

本文介绍自监督学习的概念,适用场景,以及实现自监督学习的两种任务.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/81162.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

using var connection = connectionFactory.CreateConnection(); using var 是什么意思

在 .NET 中,​​垃圾回收(Garbage Collection, GC)​​ 确实是自动管理内存的机制,但它 ​​仅适用于托管资源(Managed Resources)​​(如类实例、数组等)。然而,对于 ​…

Multicore-TSNE

文章目录 TSNE使用scikit-learn库使用Multicore-TSNE库安装方法基本使用方法采用不同的距离度量 其他资料 TSNE t-Distributed Stochastic Neighbor Embedding (t-SNE) 是一种高维数据的降维方法,由Laurens van der Maaten和Geoffrey Hinton于2008年提出&#xff0…

SI5338-EVB Usage Guide(LVPECL、LVDS、HCSL、CMOS、SSTL、HSTL)

目录 1. 简介 1.1 EVB 介绍 1.2 Si5338 Block Diagram 2. EVB 详解 2.1 实物图 2.2 基本配置 2.2.1 Universal Pin 2.2.2 IIC I/F 2.2.3 Input Clocks 2.2.4 Output Frequencies 2.2.5 Output Driver 2.2.6 Freq and Phase Offset 2.2.7 Spread Spectrum 2.2.8 快…

Spring AI应用系列——基于OpenTelemetry实现大模型调用的可观测性实践

一、项目背景与目标 在AI应用日益复杂的今天,大模型服务(如语言理解和生成)的性能监控和问题排查变得尤为关键。为了实现对大模型调用链路的可观测性(Observability)管理,我们基于 Spring Boot Spring AI…

Spyglass:官方Hands-on Training(一)

相关阅读 Spyglasshttps://blog.csdn.net/weixin_45791458/category_12828934.html?spm1001.2014.3001.5482 本文是对Spyglass Hands-on Training中第一个实验的翻译(有删改),Lab文件可以从以下链接获取。Spyglass Hands-on Traininghttps:…

PCB设计工艺规范(三)走线要求

走线要求 1.走线要求2.固定孔、安装孔、过孔要求3.基准点要求4.丝印要求 1.走线要求 印制板距板边距离:V-CUT 边大于 0.75mm,铣槽边大于0.3mm。为了保证 PCB 加工时不出现露铜的缺陷,要求所有的走线及铜箔距离板边:V-CUT边大于 0.75mm,铣槽边…

抓取工具Charles配置教程(mac电脑+ios手机)

mac电脑上的配置 1. 下载最新版本的Charles 2. 按照以下截图进行配置 2.1 端口号配置: 2.2 https配置 3. mac端证书配置 4. IOS手机端网络配置 4.1 先查看电脑上的配置 4.2 配置手机网络 连接和电脑同一个wifi,然后按照以下截图进行配置 5. 手机端证书…

【CSS】精通Flex布局(全)

目录 1. flex布局体验 1.1 传统布局 与 flex布局 1.2 初体验 2. flex布局原理 2.1 布局原理 3. flex布局父项常见属性 3.1 常见父项属性 3.2 属性值 3.3 justify-content 设置主轴上的子元素排列方式 3.4 flex-wrap设置子元素是否换行 3.5 align-items 设置侧轴上的…

力扣第447场周赛

这次终于赶上力扣的周赛了, 赛时成绩如下(依旧还是三题 ): 1. 统计被覆盖的建筑 给你一个正整数 n,表示一个 n x n 的城市,同时给定一个二维数组 buildings,其中 buildings[i] [x, y] 表示位于坐标 [x, y] 的一个 唯一 建筑。 如…

AI中常用概念的理解

1. RAG(检索增强生成) 通俗理解:就像你写作业时,先查课本 / 百度找资料,再根据资料写答案,而不是纯靠记忆瞎编。 AI 模型(比如 ChatGPT)回答问题时,先去 “数据库 / 互联…

SQLServer多版本兼容Java方案和数据采集

Maven引入 <dependency><groupId>com.microsoft.sqlserver</groupId><artifactId>sqljdbc4</artifactId><version>4.0</version></dependency><dependency><groupId>net.sourceforge.jtds</groupId><ar…

【每日八股】复习 Redis Day4:线程模型

文章目录 复习 Redis Day4&#xff1a;线程模型介绍一下 Redis 的线程模型核心线程模型&#xff08;Redis 6.0 之前&#xff09;Redis 6.0 的多线程改进Redis 真的是单线程吗&#xff1f;Redis 的线程模型剖析 上一篇 Redis 的应用我今天才完成&#xff0c;因此明天一并复习 Re…

树莓派智能摄像头实战指南:基于TensorFlow Lite的端到端AI部署

引言&#xff1a;嵌入式AI的革新力量 在物联网与人工智能深度融合的今天&#xff0c;树莓派这一信用卡大小的计算机正在成为边缘计算的核心载体。本文将手把手教你打造一款基于TensorFlow Lite的低功耗智能监控设备&#xff0c;通过MobileNetV2模型实现实时物体检测&#xff0…

vs2019编译occ7.9.0时,出现fatal error C1060: compiler is out of heap space

问题描述 visual studio 2019编译opencascade 7.9.0时&#xff0c;出现编译错误 fatal error C1060: compiler is out of heap space 解决方案 修改vs2019并行编译的线程个数&#xff0c;默认是12个&#xff0c;我改成了4个&#xff0c;问题解决 Tools > Project and Sol…

vue跨域问题总结笔记

目录 一、Websocket跨域问题 1.nginx配置 2.VUE CLI代理 3.env.development配置 4.nginx日志 5.解决 一、解决跨域的几种常用方法 1.Vue CLI代理 2.JSONP 3.WebSocket 4.NGINX解决跨域问题 6.Java解决跨域 二、Vue跨域问题详解 1. 什么是跨域 2. 跨域的例子 3.…

数据结构篇:线性表的另一表达—链表之单链表(下篇)

目录 1.前言 2.是否使用二级指针 3.插入/删除 3.1 pos位置前/后插入 3.2 查找函数 3.3 pos位置删除 3.4 pos位置后面删除 3.5 函数的销毁 4.断言问题 4.1 断言pphead 4.2 断言*pphead 5.三个文件的代码 5.1 头文件 5.2 具体函数实现 5.3 测试用例 1.前言 之前是讲…

完美解决react-native文件直传阿里云oss问题一

前言 通常情况下&#xff0c;作为前后端分离的项目来说&#xff0c;文件上传是最寻常的功能之一。虽然每个公司选择的文件管理云库各不相同&#xff0c;但实现思路基本一致。我所在公司使用阿里云oss文件管理&#xff0c;之前服务端做了透传&#xff0c;但是由于每个测试环境的…

5.运输层

5. 运输层 1. 概述 第2~4章依次介绍了计算机网络体系结构中的物理层、数据链路层和网络层&#xff0c;它们共同解决了将主机通过异构网络互联起来所面临的问题&#xff0c;实现了主机到主机的通信然而在计算机网络中实际进行通信的真正实体&#xff0c;是位于通信两端主机中的…

告别手动时代!物联网软件开发让万物自动互联

清晨&#xff0c;智能窗帘随着阳光自动拉开&#xff1b;运动时&#xff0c;手表精准记录着健康数据&#xff1b;回到家&#xff0c;室温早已调节至最舒适状态...这些场景的实现&#xff0c;都离不开物联网软件开发的技术支撑。在智能家居软件开发、智能穿戴软件开发、医疗器械软…

Fiori学习专题十二:Shell Control as Container

为了让我们的app更加适应不同的设备&#xff0c;这节课我们引入shell控件作为根元素 1.修改App.view.xml&#xff0c;加入Shell控件 <mvc:ViewcontrollerName"ui5.walkthrough.controller.App"xmlns"sap.m"xmlns:mvc"sap.ui.core.mvc"displa…