我是粉红猪佩奇,我要把粉色吹风机写进 IJCAI 论文!

347455a8bc95f44c781d10e9c442bf8a.png

文 | 智商掉了一地

当小猪佩奇的忠实观众进行AI研究,论文配图居然是这样的风格……

在介绍接下来的内容前,我们先来看一则笑话:

小猪佩奇哭着对妈妈说:“小伙伴们都说我长得像粉色吹风机。” 猪妈妈安慰道:“尽瞎说,不过宝贝,下次说话时离妈妈远一点吧,别把妈妈新烫的头发给吹乱了。”

不知道大家有没有注意过这个现象:随着年轻一代开始步入科研的道路,学术论文的画风也越来越有趣。在自然语言处理领域可以看到,从科幻电影中的Transformer,再到儿童教育节目《芝麻街》中的BERT、ELMo、ERNIE和Big Bird,越来越多的论文作者冲破论文命名需要严肃的桎梏,给自己的模型起一些富有趣味且朗朗上口的简称,让读者可以迅速记住自己的模型,同时这些模型也不负众望地在其研究领域占据了主流地位。

a8e61a395f34dc3263ddefdd1f52f31f.png

今天这篇文章的作者就在论文配图上别出心裁,给我们诠释了一位小猪佩奇爱好者在CV领域进行研究时,配图画风究竟会有多可爱。作者首次提出域信息和类别信息的解耦表达,利用双对抗网络结构学习较有影响力的类别信息。

论文题目:
Learning Disentangled Semantic Representation for Domain Adaptation

论文链接:
https://www.ijcai.org/proceedings/2019/285

点开这篇论文时,最吸引目光的无疑是这张问题图,作者借助小猪佩奇和吹风机这两类毫不相干却又有一定联系的样本,引出了本文要研究的问题。

acd2af53561935f00ff92c76b6860279.png
▲玩具的域适应示例

作者指出,现有的域自适应方法无法从特征空间提取具有域耦合信息语义信息的域不变表示,因此作者提出了用潜在可解耦语义表示(latent disentangled semantic representation)来扩展语义信息。

本文引出了以下两个问题:

  • 跨域问题中,域的不变性表示是什么?

  • 如何设计一个模型来提炼域的不变性表示?

针对第一个问题,作者从数据生成过程背后的因果机制入手,如下图所示,给定由两个独立的潜在变量生成的 x,其中域潜在变量 对域信息编码,语义潜在变量 对语义信息编码,并且假设两者相互独立。作者还考虑到域信息在不同域之间可能存在很大差异,因此推断语义潜在变量在提取域不变表示中起着重要作用

01304b08788428591f6ed69157c28f62.png
▲数据生成过程的因果模型

对于第二个问题,利用上述数据生成机制,作者提出了一种可解耦语义表示 (Disentangled Semantic Representation, DSR) 的域适应框架,如下图所示,其中 和 分别是语义和域信息的编码器。

首先通过变分自编码器重构两个独立的潜在变量,然后通过双对抗训练网络来解耦合。

f7cf18e5f11e40b00198c617232b48ea.png
▲可解耦语义表示模型的框架

重建块中,变分自编码器用于恢复语义潜在变量 和域潜在变量 。

解耦合块中,使用双对抗网络对潜在变量解耦合。图的左侧是利用了语义潜在变量 的标签对抗学习模块,融合了语义信息,并对域分类器 用梯度反转层 (GRL) 排除了所有的域信息。这是通过使用标签分类器 和域分类器 来完成的。图的右侧是域对抗学习模块,将域信息融合到 中,并从 中排除语义信息。同时将 GRL 用于标签分类器上,以便掌握来自 的所有域信息。但与语义模块不同的是,作者没有用交叉熵作为标签损失,因为目标域中的无监督学习。

06a3d586c0617df048588e3a3b2c53b9.png实验效果0a92861a32fec9589088aec5b8436792.png

实验使用的公开数据集如下:

  1. Office-31:是视觉域自适应的Baseline,包含来自三个不同域的 4652 张图像和 31 个类别:Amazon (A),Webcam (W) 和 DSLR (D)。

  2. Office-Home:是 Office-31 的升级版本,包含来自 65 类日常对象的约 15500 张图像。该数据集分为四个域:Art (Ar),Clipart (Cl),Product (Pr) 和 Real-world (Rw)。

接下来看看在两个公开数据集上的表现:

d108ad3156e9b3d66ed63da4f2df1d00.png

图中加粗表示在公开数据集上训练的最优结果。

从实验结果来看,DSR 在数据集 Office-Home 的大多数迁移任务上优于其他Baseline,尤其显著提升了硬迁移任务的分类精度,但在 W→D 和 A→D 任务上的结果低于一些比较方法,这是因为域中的样本数量过少导致 DSR 模型不足以重建可解耦的语义表示。

数据集 Office-Home 的结果也显示了 DSR 模型更容易提取相对简单的图片和更复杂的场景的语义表示,而真实图片是在现实生活中拍摄的,存在很多模棱两可的样本这样的语义信息是在域中难以被解耦合和提取。

为了验证可解耦语义表示的有效性,在任务 Ar→Cl(源域Art,目标域Clipart)上,作者还将 DSR 与两种使用类似对抗学习策略的方法利用 t-SNE 可视化进行了比较。

8e73c811a455f4bd957835478433b979.png
▲DANN(a)、MSTN(b)和DSR(c)提取的深度特征的t-SNE可视化。红点是源域样本,蓝点是目标域样本

可以看到,DSR 的对齐效果更佳,而 DANN 和 MSTN 都有大量样本的对齐存在错误。

79eea087e1a5721ce4ef0be90ee1befb.png小结3b683f7a48b4106a4d11d10bdca6501d.png

作者提出了一种用于无监督域自适应任务的可解耦语义表示模型 DSR ,该模型遵循数据生成过程的因果模型,在可恢复的潜在空间上提取分离的语义表示,也因此该模型还具有基于变分自编码器的潜在空间恢复基于双对抗学习的可解耦表示的特点。该方法的成功不仅为域自适应任务提供了有效的解决方案,而且为基于可解耦的学习方法开辟了可能性。

最后,说一句题外话,作者可爱的论文配图画风也是吸引我阅读这篇文章的原因之一,当越来越多的科研人员冲破学术论文严肃的桎梏时,也许研究的内容也会让读者阅读时感觉更亲切吧。

c20e54ff73bd5d4c2b988348008d24ca.png

71639316ffdaaac8f6cec96a1ad42eba.png后台回复关键词【入群

加入卖萌屋NLP、CV与搜推广求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

8d70c85ac1d65d695c835d5f44c68ca6.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477355.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring Boot 2.x基础教程:快速入门

简介 在您第1次接触和学习Spring框架的时候,是否因为其繁杂的配置而退却了?在你第n次使用Spring框架的时候,是否觉得一堆反复黏贴的配置有一些厌烦?那么您就不妨来试试使用Spring Boot来让你更易上手,更简单快捷地构建…

剑指Offer - 面试题64. 求1+2+…+n(递归)

1. 题目 求 12…n &#xff0c;要求不能使用乘除法、for、while、if、else、switch、case等关键字及条件判断语句&#xff08;A?B:C&#xff09;。 示例 1&#xff1a; 输入: n 3 输出: 6示例 2&#xff1a; 输入: n 9 输出: 45限制&#xff1a; 1 < n < 10000来源&…

AI社区炸锅了!一句话哄一哄就能让GPT-3准确率暴涨61%!

文 | 梦晨 明敏 发自 凹非寺源 | 量子位一觉醒来&#xff0c;机器学习社区炸了锅。因为最新研究发现&#xff0c;只要对GPT-3说一句“让我们一步一步地思考”&#xff0c;就能让它正确回答出以前不会的问题。比如下面这个例子&#xff1a;16个球中有一半是高尔夫球&#xff0c;…

全网Star最多(近20k)的Spring Boot开源教程 2019 年要继续更新了!

从2016年1月开始写博客&#xff0c;默默地更新《Spring Boot系列教程》&#xff0c;从无人问津到千万访问&#xff0c;作为一个独立站点&#xff08;http://blog.didispace.com&#xff09;&#xff0c;相信只有那些跟我一样&#xff0c;坚持维护自己独立博客的童鞋才能体会这有…

剑指Offer - 面试题65. 不用加减乘除做加法(位运算,要看哦)

1. 题目 写一个函数&#xff0c;求两个整数之和&#xff0c;要求在函数体内不得使用 “”、“-”、“*”、“/” 四则运算符号。 示例: 输入: a 1, b 1 输出: 2提示&#xff1a; a, b 均可能是负数或 0 结果不会溢出 32 位整数来源&#xff1a;力扣&#xff08;LeetCode&am…

Spring Boot中如何扩展XML请求和响应的支持

在之前的所有Spring Boot教程中&#xff0c;我们都只提到和用到了针对HTML和JSON格式的请求与响应处理。那么对于XML格式的请求要如何快速的在Controller中包装成对象&#xff0c;以及如何以XML的格式返回一个对象呢&#xff1f; 实现原理&#xff1a;消息转换器&#xff08;M…

我在斯坦福做的科研demo…要被导师带去美国国会演讲?

文 | Jazon编 | 小戏大家好&#xff0c;我是 Jazon。时光荏苒&#xff0c;一转眼我已经快要从 Stanford CS 系毕业了。今年7月&#xff0c;我将开始谷歌总部工作&#xff0c;短期内会在硅谷定居&#xff0c;湾区的朋友们欢迎约起呀。笔者去年写过一篇文章&#xff0c;分享了我研…

剑指Offer - 面试题21. 调整数组顺序使奇数位于偶数前面(双指针,原地算法)

1. 题目 输入一个整数数组&#xff0c;实现一个函数来调整该数组中数字的顺序&#xff0c;使得所有奇数位于数组的前半部分&#xff0c;所有偶数位于数组的后半部分。 示例&#xff1a; 输入&#xff1a;nums [1,2,3,4] 输出&#xff1a;[1,3,2,4] 注&#xff1a;[3,1,2,4]…

使用Cloud Studio在线编写、调试和管理Spring Boot应用

在之前的《Spring Boot基础教程》中&#xff0c;我们介绍了通过Spring官方的构建页面来生成项目&#xff0c;也介绍了通过使用Intellij中的Spring Initializr来快速构建Spring Boot/Cloud工程。在完成了基础项目构建之后&#xff0c;我们要开始进行的就是代码的开发阶段&#x…

神TM的SOTA ,看完谷歌的新论文,我对AI大厂有些失望

源 | 机器之心用数万美元 TPU 算力&#xff0c;实现在 CIFAR-10 上 0.03% 的改进&#xff0c;创造了新的 SOTA&#xff0c;但这一切值得吗&#xff1f;「我相信他们得到的数字是准确的&#xff0c;他们确实做了工作并得到了结果…… 但这样真的好吗&#xff1f;」一名机器学习研…

Springboot 2.0选择HikariCP作为默认数据库连接池的五大理由

转载自公众号&#xff1a;工匠小猪猪的技术世界 摘要: 本文非原创&#xff0c;是笔者搜集了一些HikariCP相关的资料整理给大家的介绍&#xff0c;主要讲解了为什么sb2选择了HikariCP以及HikariCP为什么这么快。 Springboot2默认数据库连接池选择了HikariCP为何选择HikariCP理由…

剑指Offer - 面试题13. 机器人的运动范围(BFS/DFS)

文章目录1. 题目2. 解题2.1 BFS2.2 DFS1. 题目 地上有一个m行n列的方格&#xff0c;从坐标 [0,0] 到坐标 [m-1,n-1] 。一个机器人从坐标 [0, 0] 的格子开始移动&#xff0c;它每次可以向左、右、上、下移动一格&#xff08;不能移动到方格外&#xff09;&#xff0c;也不能进入…

聊聊“润(run)”

文 | One day知乎大家好&#xff0c;我是one day。前不久&#xff0c;我和知乎大V陈然老师在广州的台风天上午&#xff0c;线上聊了一杯咖啡时间的天&#xff0c;老师帮忙解答了一些疑虑&#xff0c;share了一些自己的想法。主要是围绕 美国湾区互联网工作氛围、大厂&创业公…

Spring Boot使用@Async实现异步调用:使用Future以及定义超时

之前连续写了几篇关于使用Async实现异步调用的内容&#xff0c;也得到不少童鞋的反馈&#xff0c;其中问题比较多的就是关于返回Future的使用方法以及对异步执行的超时控制&#xff0c;所以这篇就来一起讲讲这两个问题的处理。 如果您对于Async注解的使用还不了解的话&#xf…

《程序员面试金典》解题目录(更新完毕)

题目来源于LeetCode上的《程序员面试金典》&#xff0c;这里做一个目录方便大家查找。另外有本人的LeetCode解题目录、《剑指Offer》解题目录、LintCode代码能力测试CAT 解题目录可点击链接查看。updated on 2020.4.17 不懂的概念可以参考《数据结构与算法之美》学习汇总 已解…

我竟在一篇AI顶会论文里见到了小猪佩奇...

声明&#xff1a;本文原创首发于公众号夕小瑶的卖萌屋。作者&#xff1a;智商掉了一地--->【我是传送门】&#xff0c;内含海量CV/NLP/ML入门资料、必刷综述、前沿论文解读、交流社群、offer神器、学习神器等在介绍接下来的内容前&#xff0c;我们先来看一则笑话&#xff1a…

程序员面试金典 - 面试题 01.01. 判定字符是否唯一(位运算,牛)

1. 题目 实现一个算法&#xff0c;确定一个字符串 s 的所有字符是否全都不同。 示例 1&#xff1a; 输入: s "leetcode" 输出: false 示例 2&#xff1a; 输入: s "abc" 输出: true限制&#xff1a; 0 < len(s) < 100 如果你不使用额外的数据结构…

Spring Boot快速开发利器:Spring Boot CLI

Spring Boot CLI&#xff08;Command Line Interface&#xff09;是一个命令行工具&#xff0c;您可以用它来快速构建Spring原型应用。通过Spring Boot CLI&#xff0c;我们可以通过编写Groovy脚本来快速的构建出Spring Boot应用&#xff0c;并通过命令行的方式将其运行起来。下…

微软发现了一个超简单的NLP上分技巧,还发了ACL2022 ??

文 | QvQ编 | Sheryc_王苏今天给大家介绍一篇来自工业界巨头微软的工作&#xff0c;这篇论文真是把资本家的嘴脸暴露的一览无余&#xff1a;用最低的成本&#xff0c;创造最高的收益&#xff08;狗头.jpg&#xff09;文章从头到尾就阐述了一个结论&#xff1a;通过在输入文本中…

程序员面试金典 - 面试题 01.05. 一次编辑(编辑距离,DP)

1. 题目 字符串有三种编辑操作:插入一个字符、删除一个字符或者替换一个字符。 给定两个字符串&#xff0c;编写一个函数判定它们是否只需要一次(或者零次)编辑。 示例 1: 输入: first "pale" second "ple" 输出: True示例 2: 输入: first "pa…