DeepMind最新发现!神经网络的性能竟然优于神经符号模型

来源:深度学习这小事

按照之前的常识,结合了算法和符号推理技术的神经符号模型(Neurosymbolic Models),会比神经网络更适合于预测和解释任务,此外,神经符号模型在反事实方面表现更好。

 

而Neural-Symbolic,本质上其实是将现代数学中的分析学和代数学结合的产物。

 

分析学擅长处理数值、函数、逼近等问题, 代数学擅长处理推演、抽象、结构等问题,如果能适当将两者结合,会有很可观的效果。

然而,近日,DeepMind的研究人员声称,在正确的测试条件下,神经网络的性能会优于神经符号模型。

 

与之前的研究结论相反,研究人员认为,对于可以衡量高级认知功能并基于视觉的任务来说,基于分布式表示的神经网络模型确实表现良好,并已经明显胜过了现有的神经符号模型。


在论文中,作者描述了一种关于视频的时空推理的体系结构,此结构可以学习到视频中的所有成分,并且所有中间的表示都贯穿分布在整个神经网络层中。

 

论文地址:https://arxiv.org/pdf/2012.08508.pdf

 

该团队表示,该体系结构在一个流行的数据集上的所有任务的表现,都超过了神经符号模型,并在反事实问题上优势最明显。


这一研究成果,可能会非常有助于设计和开发具有推断作用的机器。

 

该文章提出的神经网络架构,主要利用注意力机制,来实现对集成信息的高效提取。


有人可能要问了,什么是注意力机制呢?

 

注意力(attention)其实是一个非常常见,但是又会被忽略的事实。比如天空一只鸟飞过去的时候,往往你的注意力会追随着鸟儿,天空在你的视觉系统中,自然成为了一个背景(background)信息。

 

计算机视觉中的注意力机制(attention)的基本思想,就是想让系统学会注意力——能够忽略无关信息而关注重点信息。

 

总的来说,注意力机制就是一种一次只专注于一个元素或几个元素的算法机制。

 

对于DeepMind这一研究来说,整个训练过程都是自我监督的,这意味着该模型必须使用底层的动态机制,来推断视频中被掩盖的对象,以便提取更多信息。 

 

而且该架构可以确保视频中的视觉元素与物理对象相对应,论文作者认为,这一步骤对于更高层次的推理至关重要。

 

在实验部分,研究人员将他们的神经网络与视频表示和推理的CoLlision事件(也就是CLEVRER数据集)进行了基准比较。

 

其中,CLEVRER数据集包含由机器生成的20,000多个5秒钟的物体碰撞视频(这几种物体是三种形状,拥有八种颜色的两种材料),以及300,000多个问题和答案。


这些问答都聚焦于逻辑推理的四个要素:描述性(例如,“什么颜色” ),说明性(“造成的原因”),预测性(“接下来会发生什么”)和反事实(“如果某种情况出现,会发生什么”)。

在这里小编附上CLEVRER资源链接:

 

论文链接:https://arxiv.org/abs/1910.01442

项目链接:http://clevrer.csail.mit.edu/

 

实验结果表明,在没有预先训练,没有标记数据,且训练数据少40%的情况下,他们的神经网络和最佳神经符号模型性能相当,这无疑挑战了神经网络比神经符号模型更需要数据这一观点。


此外,它在最困难的反事实问题上的得分为59.8%(这一得分比机会模型和所有其他模型都好)。

 

同时,此模型还可以可以推广到其他任务,包括CATER(旨在预测目标对象在视频最后一帧中的位置的对象跟踪视频数据集)。


研究人员在论文中写道:“我们的研究结果证明了在得益于分布式表示的灵活性和表现力的同时,深层网络可以复制人类认知和推理的许多特性。” 

 

“神经模型在数学上也取得了一些成功,从直觉上讲,该领域需要执行严格的规则,需要操纵各种各样的复杂符号。但是,令人惊讶的是,大型神经语言模型其实并不需要需进行目标任务的明确训练,也可获得算术推理和类推的能力。

 

这表明,在扩展到更多数据,并使用更大,更高效的体系结构时,当前的神经网络局限性得到了改善。”

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/485687.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

php搜索间隔,php – 如何查找超过2个用户的匹配时间间隔

要查找user1和user2都是免费的,请尝试以下操作:selecta.datetime_start as user1start,a.datetime_end as user1end,b.datetime_start as user2start,b.datetime_end as user2end,case when a.datetime_start > b.datetime_start then a.datetime_startelse b.da…

AJAS

发送HTTP 接收服务器数据转载于:https://www.cnblogs.com/chenliuxiao/p/9288046.html

刚刚Sci-Hub和特朗普一样被永久封禁,Twitter官方:不得上诉

来源:量子位晓查 发自 凹非寺 公众号:QbitAI今天,Twitter官方宣布永久封禁特朗普的账号。而另一个账号的封禁恐怕更让科学界感到震惊。有用户发现,Sci-Hub的Twitter账号和特朗普一样,都被完全清空了。随后,…

php文件锁 阻塞区别,php文件锁阻塞模式和非阻塞模式

1、阻塞模式(如果其它进程已经加锁文件,当前进程会等其它进程解锁后继续执行)$handle fopen(‘lock.txt‘, ‘r‘);//锁定if(flock($handle,LOCK_EX)){//to do something//解锁flock($handle, LOCK_UN);}//关闭文件fclose($handle);?>2、非阻塞模式(如果其它进…

javaweb简要介绍,虚拟路径,虚拟主机

1. 静态,动态:是否随时间,地点,用户操作的改变而改变 动态网页 需要使用到 服务端脚本语言(JSP) 2. 架构: CS: Client Server eg:qq,微信,cs游戏 不足: 1.如果软…

c#之using关键字

1、using可以引入命名空间; 2、在using语句里声明的变量,使用完后会自动调用Dispose方法(实现IDisposable接口)。 using 语句允许程序员指定使用资源的对象应当何时释放资源。using 语句中使用的对象必须实现 IDisposable 接口。此…

物理学中的不确定性

来源:人机与认知实验室吴骏(香港中文大学通识教育基础课程讲师)【物理研究的只是模型,而不是真理】物理学中的确定性问题缘起于我正在教授的《与自然对话》[1] 这门课。其中节选了詹姆士华生 (James Watson) 在2003年写的一本畅销…

php链接javascript,javascript - 添加类=“行为链接”到活动页面 - PHP或JS - SO中文参考 - www.soinside.com...

我在HTML页面简单的代码&#xff1a;HomeUsersContact注&#xff1a;(在配置文件中)BASE_URL <?php define(BASE_URL, http://localhost); ?>BASE_MEMBERS <?php define(BASE_MEMBERS, BASE_URL . /members/); ?>现在&#xff0c;我需要什么&#xff1f;上课…

JSP执行流程

第一次访问&#xff1a;服务端将jsp翻译成java&#xff0c;再将Java编译成class文件 第二次访问&#xff1a;直接访问class文件较快&#xff0c;所以第一次访问比较慢&#xff0c;以后就快了 &#xff08;如果服务器代码修改了&#xff0c;则需要重新进行翻译&#xff0c;编译…

通俗易懂的来理解Iaas,Paas,SaaS

首先我们先来了解一下这几个单词的意思和完全的英文 Iaas:Infrastructure as a service 基础设施即服务 Paas:Platform as a service 平台即服务 Saas:Sofware as a service 软件基服务 怎么说&#xff0c;看这几个上面的单词是不是看的一脸懵逼了&#xff0c;不是说好了…

玩电子游戏的神经网络,告诉我们大脑是如何决策的

来源&#xff1a;混沌巡洋舰当你开车的时候&#xff0c;你的大脑会接收大量的视觉信息&#xff0c;并用它来做出驾驶的决定&#xff0c;比如什么时候刹车或者换车道。大脑需要决定在你的视野中哪些信息是做出这些决定所必需的。例如&#xff0c;另一辆车的位置是非常重要的&…

java.lang.math.trunc,java – JPA/Hibernate返回BigDecimal不长

我正在计算按月分组的SUMQuery q entityManager.createNativeQuery(qlString);q.setParameter("program", program);SuppressWarnings("unchecked")List resultList (List) q.getResultList();long tend System.currentTimeMillis();当我传入两个result…

get,post请求的编码统一

get提交方式&#xff1a;methpd"get"与地址栏&#xff0c;超链接(<href"xx">)请求方式&#xff0c;默认都属于get提交方式 http://localhost:8080/Test/front/show.jsp&#xff1f;unameadmin&upwd123&uhobbies%E8%B6%B3%E7%90%83&uhob…

编程开发之--java多线程学习总结(3)类锁

2、使用方法同步 package com.lfy.ThreadsSynchronize;/*** 1、使用同步方法* 语法&#xff1a;即用 synchronized 关键字修饰方法(注意是在1个对象中用锁还是多个对象之间用锁&#xff0c;1个对象级用锁&#xff0c;只能是同一个对象&#xff0c;多个对象之间用锁&#xff0…

2021年的第一盆冷水:有人说别太把图神经网络当回事儿

来源&#xff1a;数学中国图神经网络&#xff08;GNN&#xff09;是机器学习中最热门的领域之一&#xff0c;在过去短短数月内就有多篇优秀的综述论文。但数据科学家 Matt Ranger 对 GNN 却并不感冒。他认为这方面的研究会取得进展&#xff0c;但其他研究方向或许更重要。博客链…

phpwindexp.php,phpwind Exp 漏洞利用

phpwind Exp 漏洞利用2021-01-23 12:07:25644忘记什么时候我就拿到了,一直没发挥.由于某些原因一直没发出来,毕竟不是原创,现在有人帖出来了,我也放出来.程序代码print_r("------------------------------------------------------------------ExploitForPhpwind5.XVersio…

JSP页面元素,内置对象及request详解

JSP的页面元素&#xff1a; a. 脚本Scriptlet 1.<% 局部变量&#xff0c;Java语句 %> 2.<%! 全局变量&#xff0c;定义方法 %> 3.<% 输出表达式 %> 一般而言&#xff0c;修改web.xml&#xff0c;配置文件&#xff0c;Java&#xff0c;需要重启tomcat服务&am…

生活经验

如果把插上耳机的手机放在衣服口袋里面&#xff0c;特别是大的衣服口袋&#xff0c;手机还能来回动。这个时候耳机很容易团成一团&#xff0c;极容易把线折断。 转载于:https://www.cnblogs.com/bakblog/p/9294753.html

美国科学院报告《无止境的前沿:科学的未来75年》

来源&#xff1a;科技咨询频道作者&#xff1a;刘昊 张志强 曹玲静编译&#xff1a;刘昊 张志强 曹玲静 &#xff08;中国科学院成都文献情报中心&#xff09;2020年12月17日&#xff0c;美国国家科学院出版报告《无止境的前沿——科学的未来75年》&#xff08;The Endless Fro…

jsp内置对象--response

response&#xff1a;响应对象 提供的方法&#xff1a;void addcookie(Cookie cookie);服务端向客户端增加一个cookie对象 void sendRedirect(String location) throws IOException:页面跳转的一种方式&#xff08;重定向&#xff09; void setContetType(String type) :设置…