迁移学习还没整理好

参考文献:

1. (60 封私信 / 30 条消息) 对比学习(Contrastive Learning)概述 - 知乎

2.(60 封私信 / 30 条消息) 自监督学习和无监督 - 知乎

3.(60 封私信 / 30 条消息) 多模态视觉理解代理任务总结 - 知乎

4. 一文读懂迁移学习:从理论到实践-CSDN博客

5.(60 封私信 / 30 条消息) Transfer learning 【迁移学习综述_汇总】 - 知乎

协变量偏移(Covariate Shift)、标签偏移(Label Shift)和概念偏移(Concept Drift)等会造成数据分布差异,数据分布偏移会导致模型性能衰竭,造成模型泛化能力不足。因此我们可以引入领域自适应与迁移学习以提升模型的泛化能力。

迁移学习:通过复用预训练模型的知识,加速新任务的学习过程。其有效性源于两个基本假设:低层特征的可迁移性和任务相关性的存在。

领域自适应:通过调整模型参数或特征表示,使源域(Source Domain)训练的模型能够适应目标域(Target Domain)的数据分布。其核心思想在于构建领域不变性特征(Domain-Invariant Features),使模型在特征空间中忽略领域特异性信息。(是迁移学习中的一个重要分支)

一、迁移学习

(1)迁移理论三大基础学说:

(2)根据源领域和目标领域的不同,迁移学习可以分为以下几种类型:

(3)参考 A Survey on Deep Transfer Learning 迁移学习可以分为四类,分别是基于实例 、基于映射 、基于网络 、基于对抗四种。

这也是 A Survey on Deep Transfer Learning 提出的图

二、领域自适应(还没整理好.jpg

自监督学习为迁移学习提供高质量的基础模型。

三、自监督学习

解释:

(1) 定义:通过最大化相关样本之间的相似性并最小化不相关样本之间的相似性来学习数据表示。如图中使正向增强与原始图像相似性最大化,原始图像与不相干图像相似性最小化。

(2)对比学习常用框架:

参考(60 封私信 / 30 条消息) 对比学习(Contrastive Learning)概述 - 知乎

  • 如果是生成式对比学习,则使用MSE(出自BYOL)来作为损失函数:
  • 如果是判别式对比学习,则使用InfoNCE(出自CPC)来作为损失函数:
  • 损失函数:
  • encoder常用框架:SimSiam(集成了SimCLR、MoCo、BYOL、SwAV)
  • 常见实例:自监督学习任务包括图像旋转预测、图像拼图、对比学习、掩码语言模型(如 BERT)等。
  • 对比学习:(经典)
  • 代理任务(Proxy Tasks):利用无标注数据,通过构造合理的任务驱动模型学习,提升其在下游任务的表现。
  • 隐式监督信号:从数据本身的结构、属性或变换中自动推导出的监督信号,而不是由人工标注提供的显式标签。
  • 自监督学习定义:利用未标记数据来训练模型,是无监督学习的一种,被广泛运用于模型的预训练。
  • 自监督学习VS无监督学习:(important)我最开始一直认为这俩是等价的,但是后面发现两者还是有区别的。自监督学习属于无监督学习,但通过构造代理任务,使其更接近监督学习的范式(有明确的输入-伪标签对),通过隐式监督信号提升模型的特征提取能力。弥补了传统无监督学习(如聚类)在表示学习上的不足。
  • 领域自适应方法:
  • 基于对抗:在生成对抗性网络(GAN)的启发下,引入对抗性技术,寻找既适用于源域又适用于目标域的可迁移表达。它基于这样的假设:“为了有效的迁移,良好的表征应该是对主要学习任务的区别性,以及对源域和目标域的不加区分。”
  • 基于网络:将原领域中预先训练好的部分网络,包括其网络结构和连接参数,重新利用,将其转化为用于目标领域的深度神经网络的一部分。
  • 基于映射:Target Domain 和 Source Domain 具有不同的分布,基于映射的迁移学习是将实例从源域和目标域映射到新的数据空间。
  • 基于实例:在source domain中的数据挑挑拣拣,选择符合Target domain约束空间的数据,让这些挑出来的数据和target domain中数据一块训练。
  • 同构迁移学习:源领域和目标领域的数据具有相同的特征空间和数据分布,但任务不同。例如,从识别手写数字 0 - 9 的任务迁移到识别字母 A - Z 的任务。
  • 异构迁移学习:源领域和目标领域的数据具有不同的特征空间或数据分布。比如,将从图像领域学习到的知识迁移到文本领域。
  • 跨任务迁移学习:源领域和目标领域的任务类型不同,如从图像分类任务迁移到图像分割任务。
  • 形式训练说——模型训练 e.g:预训练模型
  • 相同要素说——数据基础 e.g:基于参数共享、基于特征共享
  • 概括化理论说——概念学习
  • 迁移学习定义:从一个任务(源领域)学到的知识(模型参数、特征表示等),应用到另一个不同但相关的任务(目标领域)上。
  • 迁移学习分类:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1132144.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

论文交导师前,如果你的细节里还没做这一步,真的很危险

论文交导师前,如果你还没做这一步,真的很危险论文写完的那一刻, 很多人都会松一口气。目录齐了, 参考文献也对了, 从头到尾读了一遍, 也没发现明显问题。于是你很自然会想:“那就交吧&#xff0…

部署 Sphinx 文档到 GitHub Pages 详细指南

部署 Sphinx 文档到 GitHub Pages 指南 本文将详细介绍如何将 Sphinx 生成的文档部署到 GitHub Pages,包括手动部署和使用 GitHub Actions 的自动部署方案。我们将以 dlt645 项目的 Python 版本文档为例进行说明。 1. 准备工作 1.1 项目结构 在开始之前&#xf…

基于ssm+vue+mysql的供应商管理系统(源码+大文档+部署调试+讲解)

#计算机毕业设计 基于ssmvuemysql的供应商管理系统(源码大文档部署调试讲解),程序讲解视频:https://b23.tv/9HIafzF

大模型常见的专用名词

• RPM(Requests Per Minute):每分钟最多允许发起多少次请求(调用次数)。超过就会报限流。  • TPM(Tokens Per Minute):每分钟最多允许处理多少 token。token 可以理解…

pycharm一运行就是test怎么改

步骤:打开 File -> Settings -> Tools -> Python Integrated Tools。在 Testing 部分,将 Default test runner 改为 Unittests。

同步互斥机制和编程方法

同步互斥机制和编程方法 文章目录 同步互斥机制和编程方法一、前言二、同步互斥机制2.1 概念回顾2.2 竞态条件(race condition)2.2.1 概述2.2.2 解决方法 2.3 具体做法及其编程2.3.1 忙等互斥2.3.2 睡眠与唤醒(软硬件结合) 三、小…

程序员必读:2026年AI智能体趋势,收藏这篇抢占先机

Google Cloud《2026 AI智能体趋势报告》揭示五大趋势:人人拥有智能体释放创造力、构建企业数字流水线、重塑礼宾式客户体验、实现安全主动防御、通过人才升级驱动价值。AI智能体正从"工具赋能"转向"生态重构",不仅提升效率&#xff…

Windows 系统版本转换工具,一键互转不用重装

前言今天分享一款Windows 系统版本一键转换工具,它无需重装系统,就能一键转换系统版本,如专业版转家庭版、家庭版转企业版,Win10/Win11 系统都支持,整个过程保留原有数据,操作简单。软件介绍1、 右键点击程…

大数据领域数据治理的质量提升秘籍

大数据领域数据治理的质量提升秘籍:从理论到实战的全链路指南 一、为什么数据质量是大数据的“生命线”? 在某电商公司的季度复盘会上,推荐算法团队负责人脸涨得通红:“过去3个月,我们的推荐转化率下降了30%——原因居…

深入理解 MCP,非常详细收藏我这一篇就够了

如何系统的学习大模型 AI ? 由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。 但是具体到个人,只能说是: “最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”…

大模型Agent架构演进:从临时拼接到按需组合的微应用之路(程序员必收藏)

文章阐述了Agent系统架构从ad-hoc临时型Agent向标准化能力再向按需组合的just-in-time微应用/界面的主流演进路线。这种演进解决了ad-hoc模式在治理、复用、安全方面的问题,通过标准化协议(MCP、A2A)和JIT身份权限管理,实现开发效率提升、运营治理优化和…

AI产品经理与大模型学习全攻略:从入门到精通,零基础也能掌握AI思维

文章系统介绍了AI产品经理与传统产品经理的区别,强调AI思维的重要性。详细解析了AI产业链结构(基础层、技术层、应用层)和AI产品经理的四象限分类(突破型、创新型、应用型、普及型)。提供了从初阶到高阶的大模型AI学习…

根据算法题目时间限制推算时间复杂度限制

核心思路:先明确基准值首先要建立一个基础认知:普通计算机在 1 秒内,大约能执行 1 亿(10^8)次 基本运算(比如加减乘除、变量赋值、条件判断等)。这个数值是经验值,不同评测机可能略有…

AI大模型学习路线:从入门到高薪,程序员收藏必备!2025年AI就业薪资表曝光

文章讲述AI领域特别是大模型方向的就业前景。科技巨头如腾讯、阿里、Meta等大力布局AI,导致人才紧缺,薪资飙升。2025年AI岗位需求增长10倍,核心技术岗供需比低至0.39。大模型研发、端侧推理等复合型人才尤为抢手,建议技术党深耕核…

FPGA应用开发和仿真【3.7】

8.5 混频和相干解调混频,即两个信号做乘法,是在数字通信中很常用的信号处理方法。考虑两个单频信号Acos(ω1t 1)和cos(ω0t),一般前者为待处理的信号,而后者为已知的参考信号&#x…

每日Java面试场景题知识点之-ELK技术栈实战应用

每日Java面试场景题知识点之-ELK技术栈实战应用 前言 在现代Java企业级项目中,日志分析是系统监控和故障排查的重要环节。ELK技术栈(Elasticsearch、Logstash、Kibana)作为目前最流行的日志分析解决方案,在Java项目中得到了广泛应…

【毕业设计】SpringBoot+Vue+MySQL “衣依”服装销售平台平台源码+数据库+论文+部署文档

💡实话实说:有自己的项目库存,不需要找别人拿货再加价,所以能给到超低价格。摘要 随着互联网技术的快速发展和电子商务的普及,线上服装销售平台逐渐成为消费者购物的主要渠道之一。传统线下服装销售模式受限于时间和空…

每日Java面试场景题知识点之-ELK日志分析

场景题:微服务架构下日志分散导致故障排查困难 问题描述 在一家大型电商平台的微服务架构中,系统包含订单服务、用户服务、支付服务、库存服务等20多个微服务实例,每个服务部署在多台服务器上。某天凌晨,用户支付功能出现异常&…

FPGA应用开发和仿真【3.8】

8.8.3 调制解调仿真 仿真模拟的系统与AM仿真时类似,结构如图8-32所示。 图8-32 WBFM调制解调仿真系统结构 代码8-16是测试平台。 代码8-16 WBFM调制解调系统测试平台 图8-33所示是一段仿真波形。解调器工作建立时输出了一段不正确的波形。 图8-33 WBFM测试平台仿…

FPGA应用开发和仿真【3.6】

7.8 PID控制器 PID控制器广泛用于控制系统,控制系统中的数字控制部分也是数字信号处理系统的一种。典型的数字PID控制器如图7-63所示,它由前向欧拉法转换连续时间PID控制器而来,其P、I、D三个参数,分别为比例、积分、微分系数,而N用于配置微分单元中滤波器的极点,将有助…