11月AI大事件回顾:GPT3开放使用/女娲视觉大模型/AE文艺复兴/...

ceffc84e1609e8b9e06ede535a891086.png

编 | iven

感谢提供本期内容的 ZenMoore、 jxyxiangyu、付瑶

大家好~ 11月的新闻速报来啦!上个月不知道大家有没有忙着写文章,反正小编是这样的:

541d8ab6d58af8cf5599deed31fe026d.png

好啦,让我们快来回顾上个月的 AI 大新闻吧!

73b040cd473c278d9132f24c9e57a167.png学术进展a5c223d4a08d572a6c95c98dbfa70ee9.png

何恺明 Masked Autoencoders:自监督恢复原图就行

像 MLM 一样直接重构图片里的像素,竟然也能 work。这篇文章构建了不对称的自编码器,用来恢复图片中 mask 掉的像素。这样朴素的想法,在 ViT 盛行的今天,显得格格不入😂

01eea41e8eeb6300ce0a6c08f714efaf.png

Yoshua Bengio 一作,长达 70 页:为主动学习拓展理论

在 NeurIPS 提出生成流网络(GFlowNets)之后,Yoshua Bengio 又为我们详细阐述了它的数学框架和数学性质。同时,对原始 GFlowNet 的理论进行了扩展。

https://arxiv.org/abs/2111.09266

Gradients are Not All You Need

梯度反传,可以说是过去几十年中机器学习复兴的主角。也正是 PyTorch TensorFlow 等自动微分库的出现,让越来越多的人进入机器学习领域。这篇工作讨论了在使用迭代可微系统时出现的一个潜在问题。

当通过迭代可微系统计算梯度时,我们需要计算由状态转换雅可比行列式的乘积组成的项。如果 Jacobian 的特征值大于 1,则梯度会爆炸。小于 1, 梯度则会消失。针对这个问题,文章给出了分析和解决方法。

https://arxiv.org/abs/2111.05803

ICLR 最高分文章

11 月 12 号,ICLR 出分,最高分文章 Contrastive Label Disambiguation for Partial Label Learning 引起了大家关注:对比学习的方法在部分标签数据上学习(比如 n 类标签,只使用其中的 m 类数据训练)竟能超过全监督学习。

https://openreview.net/forum?id=EhYjZy6e1gJ

ViT 综述:引发原作者感慨

来自联想、中科院的团队发表了 A Survey of Visual Transformers。针对 CV 的分类、目标检测、语义分割三个任务,回顾了 100+ ViT 模型。引发 ViT 作者本人感慨:这一年的进展我都没想到呢 :P

82bf8ed47882024c450bd6076e029902.png

arxiv.org/abs/2111.06091 https://twitter.com/arankomatsuzaki/status/1463692664814063625

女娲:通用视觉生成模型

MSRA 北大团队发表了文章 NUWA: Visual Synthesis Pre-training for Neural visUal World creAtion。这个工作设计了一个 3D Transformer Encoder-Decoder,可以同时处理 3D(video),2D(image),1D(text) 的数据用于视觉生成任务。在文字生成图片任务上超过了 DALL-E。

arxiv.org/abs/2111.12417

d725d0af3ea025f2d1b939fa79839ccd.png业界新闻7945476471da1fb10a84ac822c564ded.png

OpenAI 取消 GPT-3 的等待名单

去年五月发布的 GPT-3 一直需要申请许可才能访问。11月18日,OpenAI 终于取消了等待名单机制,所有开发者都可以直接邮箱登录,使用 API。

8de46b6f43a257d44821da2dcddbf5da.png

Deepmind 登上 Nature 封面:给数学家提供启发

这篇文章探索了机器学习在识别数学结构和模式方面的潜力,并帮助数学家找到他们可能从未发现的发现——这是第一次证明人工智能可以在纯数学的前沿提供帮助。这个框架可以快速验证,两个量之间的关系是否值得研究。

088204d34a11f408edff369848a608ec.png

https://www.nature.com/articles/d41586-021-03593-1
https://deepmind.com/blog/article/exploring-the-beauty-of-pure-mathematics-in-novel-ways

97e44375451c973798ac8d3e566bf4eb.png资源工具0a90e3a4d63a45f9fa9c81e350921994.png

Sebastian Ruder 最新 QA 教程

Sebastian Ruder 在 EMNLP 2021 的最新 tutorial,主题是 Multi-Domain Multilingual Question Answering。这可能是第一个包含“特定领域内”和“跨语言” QA 的教程。

f039ca99806ef1d1384c43a54a715a31.png

教程主页:
https://github.com/sebastianruder/emnlp2021-multiqa-tutorial

幻灯片地址:
https://tinyurl.com/multi-qa-tutorial

读论文神器登顶 B 站热搜:沈向洋博士带大家读论文

在线论文阅读神器 ReadPaper 由沈向洋博士创办的 IDEA 旗下团队研发,其收录了近 2 亿篇论文,提供了提取图表、在线检索、翻译、做笔记等功能。页面中的论文速读功能中,很有可能会出现一位大佬,通过十个问题带你速读论文。

91333f8ee2a26cb2ea2100dbe42a760f.png
▲readpaper.com

https://www.bilibili.com/video/BV1dg411P7De

22832ee90689f8a2d470bca8522872b7.png八卦趣事c23e77d724b648a7742e12375b67fdeb.png

完善的同行评议还有多远?

视频博主 Yannic Kilcher 分析了 NeurIPS 2021 在 Openreview 上多轮打分结果之间的一致性,发现除了最优秀的很小一部分文章,其他文章在不同审稿人之间的评价几乎是完全随机的。

350f84423b1a9d4a8ce08ef88678100e.png

https://youtu.be/DEh1GR0t29k

77d2fe37bb5ad36bc956fbdc2f6530da.png原创推荐66a94eca9cab4b00d252395005de887a.png

  • 6 年大厂面试官,谈谈我对算法岗面试的一些看法正在求职的小伙伴一定要认真学习这篇文章!市面上的面经只教人怎样表现,这篇文章告诉我们,面试到底在考察什么能力,面试官是怎么考虑怎么设计面试的。

  • 11 个好用的科研工具推荐!工作效率提升 max!好多给大家节省时间的科研小工具!好多痛点能被这篇文章解决:调整引用格式、公式表格转成 latex、给模型起名字、定制化 arXiv 阅读工具……

  • 吐血整理:论文写作中注意这些细节,能显著提升成稿质量非常具体又实用的论文写作建议。评论区网友表示“每天看一遍可以大幅减少被导师骂的概率”。

  • Facebook 推出 8 比特优化器,两行代码拯救你的显存!也不必研究这个优化器是啥原理,点开文章,复制两行代码——显存立减 75%。咱直接 base 变 large,其他啥都不变,不香嘛~

  • 图灵奖大佬 Lecun 发表对比学习新作,比 SimCLR 更好用!这篇文章为大家分享了 Yann Lecun 等人发表的《Decouple Contrastive Learning》。这篇文章仅仅对 InfoNCE 的表达式进行了一处修改,就大大缓解了 InfoNCE 对于大 Batch Size 的需求问题,并在不同规模的评测数据集上取得了更好的结果。

好啦!这个月的总结就到这里!如果有漏下的,我们评论区见~

5c041ca9c9704aecb3fbba24bdaa9d7c.png萌屋作者:𝕚𝕧𝕖𝕟

在北大读研,目前做信息抽取,对低资源、图网络都非常感兴趣。希望大家在卖萌屋玩得开心 ヾ(=・ω・=)o

作品推荐

  1. 老板让我用少量样本 finetune 模型,我还有救吗?急急急,在线等!

  2. 谷歌:CNN 击败 Transformer,有望成为预训练界新霸主!LeCun 却沉默了...

  3. 中文 BERT 上分新技巧,多粒度信息来帮忙

  4. 恕我直言,很多小样本学习的工作就是不切实际的

  5. 你的 GNN,可能 99% 的参数都是冗余的

2c9c9a65c66a1dbdb50f9437ffe9496b.png后台回复关键词【入群

加入卖萌屋NLP/IR/Rec与求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

41c04e578aa3039eac2ab791122b5149.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477811.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

开源开放 | 开源立体化漏洞情报知识图谱(四维创智)

OpenKG地址:http://openkg.cn/dataset/vuln-sprocket开放许可协议:CC BY-SA 4.0 (署名相似共享)贡献者:四维创智(李德斌,孙基栩,鲍晨阳)1. 前言随着时间的推移&#xff0…

LeetCode 515. 在每个树行中找最大值(层序遍历)

1. 题目 您需要在二叉树的每一行中找到最大的值。 示例: 输入: 1/ \3 2/ \ \ 5 3 9 输出: [1, 3, 9]来源:力扣(LeetCode) 链接:https://leetcode-cn.com/problems/find-largest-value-in-each-tree-row 著作…

YUI事件体系之Y.CustomEvent

上一篇文章中,简要介绍了YUI实现AOP的Y.Do对象。 接下来,我们继续对YUI事件体系进行探索。本次要介绍的是Y.CustomEvent对象,从命名上就可以看出,这个对象在整个YUI事件体系中十分重要。它建立起整个自定义事件的体系,…

GBDT是如何成为推荐系统顶级工具人的?

文 | 水哥源 | 知乎Saying1. 集成学习的ensemble注意一定要读作昂三姆包而不是印三姆包,一天一个算法工程师装x小技巧2. 区别bagging和boosting的准则是,先训练的模型对于后训练的模型是否有影响3. GBDT中,B(boosting)…

会议交流 | 如何提升推荐系统的可解释性?——DataFunSummit2022知识图谱在线峰会...

背景介绍知识图谱及特征学习结合智能推荐,可解决数据稀疏性及冷启动问题,更好的提升推荐决策场的准确性、多样性及可解释性,进而提升各个场景的推荐决策效率和体验。3月12日13:30-16:50,在DataFunSummit2022:知识图谱在…

LeetCode 143. 重排链表(链表反转+快慢指针)

1. 题目 给定一个单链表 L:L0→L1→…→Ln-1→Ln , 将其重新排列后变为: L0→Ln→L1→Ln-1→L2→Ln-2→… 你不能只是单纯的改变节点内部的值,而是需要实际的进行节点交换。 示例 1: 给定链表 1->2->3->4, 重新排列为…

YUI事件体系之Y.Do

YUI团队在种种场合不断的夸耀自己的事件体系是多么强大: YUI 3′s Event module is one of the strengths of the library –Eric Miraglia, YUI Theater — Luke Smith: “Events Evolved”YUI 3 is not all about DOM manipulation — it also contains a robust …

论文浅尝 | 采用成对编码的图卷积网络用于知识图谱补全

笔记整理:姚祯,浙江大学在读硕士,研究方向为知识图谱表示学习,图神经网络。论文引用:Liu S, Grau B, Horrocks I, et al. INDIGO: GNN-based inductive knowledge graph completion using pair-wise encoding[J]. Adva…

调研了下 AI 作曲,顺便做了期视频...快进来听歌!

文 | 白鹡鸰编 | 小轶视频 | 白鹡鸰嗨,大家好!这里是卖萌屋,我是白鹡鸰。今天和大家聊聊人工智能作曲。人工智能在音乐领域的应用已经非常常见了,像听歌识曲、曲风分类、自动扒谱等等,而 利用机器来替代人类作曲 &…

LeetCode 1275. 找出井字棋的获胜者(位运算)

1. 题目 A 和 B 在一个 3 x 3 的网格上玩井字棋。 井字棋游戏的规则如下: 玩家轮流将棋子放在空方格 (" ") 上。第一个玩家 A 总是用 “X” 作为棋子,而第二个玩家 B 总是用 “O” 作为棋子。“X” 和 “O” 只能放在空方格中,而…

论文浅尝 | DSKReG:基于关系GNN的推荐知识图谱可微抽样

笔记整理:李爽,天津大学硕士链接:https://dl.acm.org/doi/pdf/10.1145/3459637.3482092动机在信息爆炸的时代,推荐系统被广泛研究和应用,以发现用户的偏好信息。RS在冷启动时性能较差,如果将知识图谱(Knowl…

改变世界,改善生活:我从科沃斯扫地机器人X1,看到了AI新的希望

深度学习是当代人工智能的核心,计算机视觉、语音、NLP则是当代人工智能落地的热门应用方向。然而,机器人、智能agent这种看起来更加“人工智能”的话题却在大众视野出现的越来越少,取而代之的热点讨论反而是看似与人工智能关联不是那么直接的…

数据开放平台的配置管理

背景 美团是数据驱动的技术公司, 非常重视使用数据的效率。为了达到这个目标,我们将数据以开放平台的形式开放给需求方。例如,帮助需求方开发报表的报表开放平台,帮助需求方获取数据的自助查询平台,让需求方参与数据建…

LeetCode 1271. 十六进制魔术数字(进制转换)

1. 题目 你有一个十进制数字,请按照此规则将它变成「十六进制魔术数字」:首先将它变成字母大写的十六进制字符串,然后将所有的数字 0 变成字母 O ,将数字 1 变成字母 I 。 如果一个数字在转换后只包含 {“A”, “B”, “C”, “…

评测任务征集 | 全国知识图谱与语义计算大会(CCKS 2022)

评测任务征集全国知识图谱与语义计算大会(CCKS 2022)2022年8月25-28日,秦皇岛http://sigkg.cn/ccks2022/全国知识图谱与语义计算大会(CCKS: China Conference on Knowledge Graph and SemanticComputing)由中国中文信息…

SegmentFault 美团云采访实录

约半年前,美团悄然上线了美团云(Meituan Open Services,简称MOS),这是美团网根据自身虚拟化平台开发和运维经验开放的云计算服务,类似AWS。 美团 CEO 王兴可能是中国最知名的连续创业者,曾创办校…

开局一段扯,数据全靠编?真被一篇“神论文”气到了

文 | 苏剑林(追一科技)编 | 智商掉了一地看来以后我们看论文的时候,不仅要关心论文成绩的可复现性,还要留意它们的求和、均值、方差等有没有算错,否则真的是“无奇不有”!!这篇文章谈一下笔者被…

LeetCode 147. 对链表进行插入排序(链表)

1. 题目 对链表进行插入排序。 插入排序的动画演示如上。从第一个元素开始,该链表可以被认为已经部分排序(用黑色表示)。 每次迭代时,从输入数据中移除一个元素(用红色表示),并原地将其插入到…

征稿 | 软件学报专刊征文:知识赋能的信息系统

伴随着人工智能的浪潮,智慧信息系统的发展方兴未艾,正处于由感知智能到认知智能转变的关键时期。要实现认知智能的系统跃升,离不开知识的赋能。在数字化转型背景下,数据对象和交互方式的日益丰富和变化,对以知识图谱为…

基于Flume的美团日志收集系统(二)改进和优化

在《基于Flume的美团日志收集系统(一)架构和设计》中,我们详述了基于Flume的美团日志收集系统的架构设计,以及为什么做这样的设计。在本节中,我们将会讲述在实际部署和使用过程中遇到的问题,对Flume的功能改进和对系统做的优化。 …