深度学习已经触底?这篇文章的观点令人信服吗?

640?wx_fmt=png

来源:机器之心

摘要:AI 迎来另一寒冬?这是 2018 年下半年至今我们一直能听到的一种声音。这类唱衰的文章一经发布,总是能博人眼球。这篇发表在 Medium 上的文章探讨了 AI 的历史和现在,泛谈了深度学习的局限性,思考 AI 寒冬的到来。你认同这篇文章的观点吗?


许多人认为,算法可以利用认知意识来超越人类。机器可以在没有人类干预的情况下识别和学习任务。他们完全可以「思考」。许多人甚至提出了我们是否可以打造机器人配偶的问题。


但以上的讨论并非今天才出现的话题。如果我告诉你早在上世纪 60 年代,AI 领域先驱 Jerome Wiesner、Oliver Selfridge 和 Claude Shannon 就坚信这些将发生在不远的将来,你会作何感想?


让我们回到 1973 年,彼时 AI 炒作遇冷。英国议会指定 James Lighthill 爵士起草英国人工智能研究现状报告,该报告批评人工智能研究没有达到其所宣称的效果。有趣的是,Lighthill 还指出了专门的程序(或编程人员)比 AI 表现要好得多,AI 在现实世界环境中没有前景。因此,英国政府取消了所有 AI 研究经费。


在大洋彼岸,美国国防部也曾斥巨资开展 AI 研究,但在遇到同样的挫折后也取消了几乎所有经费,这些挫折包括:对 AI 能力的夸大、高成本无回报,以及在现实世界中看不到期望的价值。


到了 20 世纪 80 年代,日本在人工智能领域大胆尝试,提出了「第五代计算机」项目。然而,在耗费了 8.5 亿美元之后,这一项目不幸流产。


首个 AI 寒冬


20 世纪 80 年代末,AI 进入寒冬,这是计算机科学的一段黑暗时期,组织和政府所支持的人工智能研究都交付失败,造成了沉没成本。这样的失败使 AI 研究消沉数十年。


到了 20 世纪 90 年代,「AI」成了一个骂人的词,这种状况一直持续到 21 世纪初。那时人们普遍相信「AI 没什么用」。编写智能程序的软件公司使用的词是「搜索算法」、「业务规则引擎」、「约束求解器」、「运筹学」。值得一提的是,这些珍贵的工具的确来自 AI 研究,但由于没有完成更伟大的使命,它们不得不换了个名字。


2010 年左右,情况发生了转变。人们对 AI 的热情重新燃烧起来,图像分类竞赛吸引了媒体的眼球。硅谷坐拥海量数据,首次达到可以让神经网络发挥作用的程度。


到了 2015 年,AI 研究已经占据了财富 500 强公司的大笔预算。通常,这些公司是由于 FOMO(害怕错过)而不是实际用例驱动的,他们害怕被自己的竞争对手甩在后面。毕竟,拥有一个能够识别图像中物体的神经网络是一件酷炫的事情!外行认为天网(SkyNet)具备的强大能力一定会出现。


但这真的是在向真正的人工智能迈进吗?或许只是重演历史,只不过这一次有很多成功用例。


AI 到底是什么?


我曾经很不喜欢「人工智能」这个词。它的概念模糊又深远,且更多的是被营销人员而不是科学家来定义。当然,市场营销和流行语可以说是刺激积极变化和拥抱新思想的必要条件。然而,流行语又不可避免地会导致混乱、模糊。我的新智能手机有「AI 铃声」功能,在嘈杂的环境下会自动加大铃声。我想大概那些可以用一系列「if」条件句或简单线性函数编程的东西都能叫「AI」吧。


如此,人们对「AI」的定义存在广泛争议也就不足为奇了。我喜欢 Geoffrey De Smet 的定义,他认为「AI 解决方案」针对的是那些答案不明和/或存在不可避免误差的问题。这样就包括了从机器学习到概率和研究算法的很多工具。


也可以说,AI 的定义在不断发展,并只包括突破性进展,而昨日的成功(如光学字符识别和语言翻译)则不再被视为「AI」。因此「AI」是一个相对的术语,并不绝对。


近年来,「AI」常与「神经网络」绑在一起,这也将是本文的重点。当然,还有其它的「AI」解决方案,如机器学习模型(朴素贝叶斯、支持向量机、XGBoost)和研究算法。但神经网络无疑是当前最热门、最受追捧的技术。


AI 的「文艺复兴」?


2010 后,AI 宣传再次变得火热的原因仅仅是因为掌握了一项新任务:分类。具体来说,利用神经网络,科学家开发了一些有效的方法来对大多数类型的数据(包括图像和自然语言)进行分类。甚至自动驾驶汽车也属于分类任务,汽车周围道路的每张图像被转化为一组离散动作(汽车、刹车、左转、右转等)。


在我看来,自然语言处理比单纯的分类要更令人印象深刻。人们很容易认为这些算法是有感知的,但如果你仔细研究它们,你会发现它们依赖的是语言模式而不是有意识构建的思想。这会带来一些有趣的结果,比如这些机器人会为你操控骗子:



自然语言处理最令人印象深刻的壮举可能是 Google Duplex,它能让你的手机代你打电话,特别是预约。但是,你要知道 Google 可能只是为这个特定任务训练、构建甚至硬编码了该「AI」。当然,Google Duplex 的声音听起来很自然,有停顿,如「啊…嗯」,不过,这些仍是通过对语音模式进行操作来完成的,而不是通过实际推理和思考。


所有这些都令人印象深刻,并且肯定有一些有用的应用。但我们的确需要降低期望并停止宣传「深度学习」的能力了。否则,我们可能会发现自己陷入另一个 AI 寒冬。


历史总是相似的


康奈尔大学的 Gary Marcus 写了一篇关于深度学习天花板的文章,并提出了几个发人深省的观点(这篇文章传播开来后,他又写了一份有趣的续篇)。Rodney Brooks 则整理时间表,并通过引用的研究来追踪其人工智能炒作周期预测。


持怀疑观点的人有几个共同点。神经网络需要大量数据,而即使在今天,数据也是有限的。这也是为什么你在 YouTube 上看到的「游戏」AI 示例需要连续几天不断地输掉游戏,直到神经网络找到获胜模式。


神经网络的「深度」在于它们有多层节点,而不是因为它对问题有深度理解。这些层还使神经网络难以理解,甚至其开发者都无法理解。最重要的是,神经网络触及其他问题空间(如旅行推销员问题,TSP)时会出现回报减少的情况。为什么在搜索算法更有效、更可扩展、更经济的情况下,我还要用神经网络解决 TSP 问题?当然了,很多人想使用神经网络解决该问题,但有趣的是,神经网络似乎很少超过任何专门算法。


Luke Hewitt 在《The Unreasonable Reputation of Neural Networks》一文中给出了最好的解释:


仅仅基于单个任务就凭直觉判断智能机器能够用得多广或有多大能力并不是什么好主意。20 世纪 50 年代的下棋机器惊艳了研究人员,许多人将其作为迈向人类水平推理的一大步,但我们现在意识到,在该游戏中达到或超越人类水平比达到人类水平通用智能容易得多。实际上,即使是最优秀的人类也会轻易被简单的启发式搜索算法打败。人类或超人类的表现不一定是在大多数任务中接近人类表现的垫脚石。


我认为应该指出的是,神经网络的训练需要利用许多软件,消耗大量能量。我感觉这是不可持续的。当然,神经网络预测的效率比它训练出来的要高得多。然而,我认为,为了实现人们在神经网络上的野心,神经网络需要更多训练,消耗的能量、成本将指数级增长。当然,计算机越来越快,但芯片制造商能否继续维持摩尔定律?


出于这些原因,我认为又一个 AI 寒冬即将到来。越来越多的专家和博主指出这些局限。企业仍然斥巨资招募最好的「深度学习」和「AI」人才,但我认为企业意识到深度学习并非它们所需只是时间问题。更糟的是,如果你的公司没有谷歌那样的研究预算、博士人才或海量用户数据,那么你很快就会发现你所实践的「深度学习」前景有限。


每个 AI 寒冬之前总会出现很多科学家夸张、炒作其研究的潜力。他们并不满足于称自己的算法能做好一项任务,而是想让算法适应任意任务,或者至少给人这样的印象。例如,AlphaZero 擅长棋类游戏,于是媒体的反应是「天啊,通用人工智能到来了!机器人来了!」然后科学家没有纠正他们,而是鼓励他们使用此类词汇。毕竟,降低期待不利于 VC 融资。尽管有一些局限,但 AI 研究者仍然人格化其算法,他们可能出于其他原因,这更像是一个哲学问题,而非科学问题。本文最后将讨论这个问题。


那么,接下来呢?


当然并非所有使用「机器学习」或「AI」的企业实际上使用的是「深度学习」。一个好的数据科学家可能会受雇去构建神经网络,但是在她真正研究这个问题时,构建朴素贝叶斯分类器似乎更合适。对于成功使用图像识别和语言处理技术的公司而言,它们将乐此不疲。但是我认为神经网络并没有走出这些问题空间。


之前的 AI 寒冬对拓宽计算机科学的边界具有很大的破坏性。必须指出有用的工具出自此类研究,如可以在国际象棋比赛中夺冠或在交通问题中最小化成本的搜索算法。简而言之,这些出现的创新性算法通常只擅长一项特定任务。


我想表达的是,很多问题已经有许多被证实有效的解决方案。要想顺利度过寒冬,你最好专注于你想解决的问题并理解其本质,然后为该问题提供一个直观的解决方案路径。如果想对文本信息进行分类,你或许想使用朴素贝叶斯分类器。如果尝试优化交通网络,你或许应该使用离散优化。不用管同辈压力,你可以对卷积模型抱着适当的怀疑态度,并质疑它的正确性。


如果你不买毕达哥拉斯学派的帐,那你最大的努力也就是让 AI「模拟」行为,创造出它有情感与思想的错觉。


关于深度学习不是解决其中大部分问题的正确方法,这篇文章解释的非常明了。不要尝试为自己的问题寻求一种通用的 AI 解决方案,因为你找不到的。


我们的想法真的是点积吗?哲学 vs 科学


本文最后,我想说比起科学问题,这更像是一个哲学问题。我们的每一个想法和感觉只是一些以线性形式相乘、相加的数字吗?我们的大脑只是一个整天做点积运算的神经网络吗?将人类意识简化为数字矩阵,这听起来像毕达哥拉斯学派。或许这正是很多科学家认为可能出现通用人工智能的原因。


如果你不相信毕达哥拉斯学派,那么你所能做的就是让 AI「模拟」一种幻象,即它拥有情绪和想法。一个完全不理解中文的翻译程序可以通过寻找概率模式来模拟出自己理解中文的假象。那么,当你的手机「识别」出狗狗的照片时,它真的认识狗吗,还是它只是看到了它曾见过的数字模式?


在这篇文章的评论区,有读者提出了质疑:


@Toby Walsh:


本文开头有一个经典错误,作者表示「因此,英国政府取消了所有 AI 研究经费。」这种说法是不对的。Lighthill 的报告的确导致 AI 经费减少,但有些地方的 AI 研究仍旧受到政府资助,比如爱丁堡大学(我的 AI 方向博士学位就是 20 世纪 80 年代受英国政府资助在爱丁堡大学取得的)、艾塞克斯大学和萨塞克斯大学。实际上,在 Lighthill 的报告出来十年之后,阿尔维计划(Alvey programme)甚至还大幅增加了 AI 的研究经费。


@Owen Liu:


我认为深度学习架构确实快到极限,但其「应用」并不是这样。


  • 第一种类型:深度强化学习成功结合了深度学习函数逼近器和传统强化学习(如动态规划),并作出了巨大贡献,开创了学术研究的多种可能性。未来可能会有更多此类例子。

  • 第二种类型:几乎没有自动驾驶汽车直接使用神经网络控制汽车。深度学习通常作为感知任务中的一个模块。决策、轨迹追踪和控制都是通过其它算法实现的(如优化技术)。深度学习可用作改变行业的大系统中的一部分(没有深度学习,自动驾驶汽车几乎无法在真实的复杂环境中获得任何合理的结果)。


是的,工具本身正在走向极限,炒作也将慢慢熄火,但深度学习仍然是非常有用的工程技术。


@Kristian:


文章第一部分很不错,但我对后面的内容有些失望。这篇文章并没有真正讨论目前机器学习方法的技术局限,比如它们离模拟真正神经系统还非常遥远,也因此可能缺乏实现通用智能系统所需的灵活性和效率。


原文链接:

https://towardsdatascience.com/is-deep-learning-already-hitting-its-limitations-c81826082ac3


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。


  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”


640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/492951.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Leetcode unique-paths

转载自:http://blog.csdn.net/linhuanmars/article/details/22126357 原题链接: http://oj.leetcode.com/problems/unique-paths/ 这道题是比较典型的动态规划的题目。模型简单,但是可以考核动态规划的思想。我们先说说brute force的解法,…

阿里商业操作系统重磅发布!新零售绝对不止是零售层面的问题

来源:物联网智库摘要:2019年1月11日,阿里巴巴one商业大会在杭州隆重召开,阿里巴巴CEO张勇发表了题为《阿里巴巴商业操作系统》的主题演讲,并将此次大会称为“数字经济时代的网商大会”。会上,张勇宣布——在…

PHP操作MongoDB GridFS 存储文件

PHP操作MongoDB GridFS 存储文件&#xff0c;如图片文件 我的测试代码&#xff1a; 1、前端上传文件html index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">…

JS入门程序(一)

程序代码如下&#xff1a; <!DOCTYPE html> <html lang"en"><head><title>Bootstrap 101 Template</title><link href"css/bootstrap.min.css" rel"stylesheet" media"screen"></head><…

Oracle运行set autotrace on报错SP2-0618、SP2-0611

SQL> set autotrace on SP2-0618: 无法找到会话标识符。启用检查 PLUSTRACE 角色 SP2-0611: 启用 STATISTICS 报告时出错 原因: PLUSTRACE角色不存在 解决办法&#xff1a; conn / as sysdba %ORACLE_HOME%\sqlplus\admin\plustrce.sql grant plustrace to hr; 转载于:https…

万字长文回顾智能驾驶进化史

来源&#xff1a;软件定义世界&#xff08;SDX&#xff09;作者&#xff1a;吴甘沙、张玉新摘要&#xff1a;当卡尔 本茨发明汽车&#xff0c;人类进入汽车时代时&#xff0c;科学技术就对人类的 “ 出行 ” 进行了新的定义&#xff0c;而随着技术的不断发展与进步&#xff0c…

组合数学基本工具-- 排列与组合以及简单公式

排列 从n个不同元素中任取m&#xff08;m≤n&#xff09;个元素&#xff0c;按照一定的顺序排列起来&#xff0c;叫做从n个不同元素中取出m个元素的一个排列。当mn时所有的排列情况叫全排列。 P(n,m)n(n-1)...(n-m1)n!/(n-m)! 特别的&#xff0c;定义0!1 组合 组合公式是指从…

atitit.动态加载数据库配置in orm hibernate mybatis

atitit.动态加载数据库配置in orm 1. 动态加载数据库配置的优点::: 1 1.1. 组合多个配置文件... 1 1.2. 连接多个数据库 1 2. 基本的流程:::getCfg内存对象,,,,生成工厂类,在opoenSession 1 2.1. Hibernate动态添加配置流程 1 2.2. mybatis动态添加配置流程 1 2.3. #hb code 2 …

重磅!德勤TMT行业2019十大预测,遍地黄金的中国机会

来源&#xff1a;智东西摘要&#xff1a;着眼于全球科技、传媒和电信行业在未来5年的关键趋势&#xff0c;分析颠覆性技术变革及未来可能会影响行业内企业的因素。全球最大的会计事务所德勤于近日发布了《2019科技、传媒和电信行业预测》报告&#xff0c;该报告着眼于全球科技、…

组合数学-- 放回取样基础公式证明

放回取样 用CR(m , r) 表示放回取样或者重复取样时一个m集合的r组合的数量&#xff0c;例如在允许放回取样的情况下&#xff0c;集合{a , b}的4个元素的组合可以得到下面的结果&#xff1a; {a,a,a,a}, {b,b,b,b}, {a,a,a,b}, {a,a,b,b}, {a,b,b,b} 下面我们给出可放回取样…

PHP环境安全性能检查

PHP环境安全性能检查 PHP在Linux环境下安全配置是一个复杂的过程&#xff0c;其中涉及到很多的细节设置&#xff0c;在这里发出来一个脚本&#xff0c;通过这个脚本来检测你的PHP环境是否存在安全隐患&#xff0c;从而针对这些对你的PHP环境进行加固。功能&#xff1a; 1.检测P…

集合的所有子集的算法

转载自&#xff1a;http://blog.csdn.net/yzl20092856/article/details/39995085 求集合的所有子集的算法 对于任意集合A&#xff0c;元素个数为n&#xff08;空集n0&#xff09;&#xff0c;其所有子集的个数为2^n个 如集合A{a,b,c},其子集个数为8&#xff1b;对于任意一个…

经济学人: Arm,孙正义手中的这只水晶球正在帮助他预测未来

来源&#xff1a;经济学人编译&#xff1a;机器之能 高璇摘要&#xff1a;除了看中 Arm 出色的盈利能力&#xff0c;对于孙正义来说&#xff0c;Arm 更像是未来计算应用的信息交换中心&#xff0c;虽然不能给软银具体的投资建议&#xff0c;但 Arm 确实可以告诉孙正义有前景、值…

C++开源项目

转载自&#xff1a;http://www.cnblogs.com/liinux/ 程序员要站在巨人的肩膀上&#xff0c;C拥有丰富的开源库&#xff0c;这里包括&#xff1a;标准库、Web应用框架、人工智能、数据库、图片处理、机器学习、日志、代码分析等。 github:https://github.com/fffaraz/awesome-…

深入浅出浮点数

1. 什么是浮点数在计算机系统的发展过程中&#xff0c;曾经提出过多种方法表达实数。典型的比如相对于浮点数的定点数&#xff08;Fixed Point Number&#xff09;。在这种表达方式中&#xff0c;小数点固定的位于实数所有数字中间的某个位置。货币的表达就可以使用这种方式&am…

深度解析2019中国机器人行业年会主旨报告:把脉中国机器人发展,助力产业创新与协作共融...

来源&#xff1a;机器人大讲堂摘要&#xff1a;1月10日&#xff0c;由机器人大讲堂联合主办的2019中国机器人行业年会在北京盛大开幕。2018年经济下行趋势明显&#xff0c;迫使我们能沉下心来面对之前异常火爆的机器人市场&#xff0c;整个行业开始变得跌跌撞撞&#xff0c;很多…

矩阵的物理意义

转载自&#xff1a;http://blog.csdn.net/NightkidLi_911/article/category/2428737 &#xff08;一&#xff09; 如果不熟悉线性代数的概念&#xff0c;要去学习自然科学&#xff0c;现在看来就和文盲差不多。”&#xff0c;然而“按照现行的国际标准&#xff0c;线性代数是…

一些看起来简单做起来难的程序员笔试面试题集锦

1、判断三个bool值中是否至少有两个bool为真&#xff1f; 此题有几种不同的解法 &#xff08;1&#xff09;传统解法 bool leastTwo(bool a, bool b, bool c){return (a&&b) || (b&&c) || (c&&a); }&#xff08;2&#xff09;如果学过电路的可以考虑利…

如何防止基因编辑技术突破底线:警惕科学狂人再现

作者&#xff1a;胡丹萍 吴跃伟 刘楚来源&#xff1a;澎湃新闻从前隅于学界的基因编辑一词&#xff0c;在2018年&#xff0c;有如一声惊雷传入寻常百姓家。DNA和基因是生物体的核心代码&#xff0c;使用一组生物分子像剪刀或橡皮一样精确地改变基因序列即基因编辑技术。几十年来…

二分查找算法java

二分查找又称折半查找&#xff0c;它是一种效率较高的查找方法。 折半查找的算法思想是将数列按有序化(递增或递减)排列&#xff0c;查找过程中采用跳跃式方式查找&#xff0c;即先以有序数列的中点位置为比较对象&#xff0c;如果要找的元素值小于该中点元素&#xff0c;则将待…