
1. AI
1.1. AI已经发展成一门涵盖许多子领域的重要学科
1.2. 机器学习是迄今为止AI应用最成功的子领域
1.2.1. 在这个领域中,最大的技术突破就是深度学习
1.3. “人工智能”“机器学习”和“深度学习”的时候,可能不会把它们的概念区分得那么清楚,有时候,这几个词会被混用
1.4. 2016年,基于深度学习技术开发的围棋棋手AlphaGo击败了韩国棋手李世石,令世界为之震惊,而深度学习也借此彻底点燃了人们对AI的热情
2. 深度学习
2.1. 第一篇阐述深度学习的学术论文发表于1967年
2.1.1. 这项技术却花了近50年的时间才得以蓬勃发展,之所以经历了这么长的时间,是因为深度学习需要海量的数据和强大的算力,才能训练多达几千层的神经网络
2.2. 如果把算力比作AI的引擎,那么数据就是AI的燃料,直到最近10年,算力才变得足够高效,数据才变得足够丰富
2.2.1. 如今,智能手机所拥有的算力,相当于1969年美国国家航空航天局(NASA)把尼尔·阿姆斯特朗送上月球时所用电脑算力的数百万倍
2.2.2. 2020年的互联网数据量几乎是1995年时的1万亿倍
2.3. 受人类大脑内部复杂的神经元网络的启发,深度学习模拟生物神经网络,构建出包括输入层和输出层在内的人工神经网络,当将数据输入该网络的输入层后,在输出层就会显现出相应的处理结果
2.3.1. 中间层
2.3.1.1. 又称隐藏层
2.4. 尽管深度学习的最初灵感来源于人类的大脑,但二者的运作方式截然不同
2.4.1. 深度学习所需要的数据量远比人脑所需要的多得多
2.4.2. 一旦经过大数据训练,它在相同领域的表现将远远超过人类
2.4.2.1. 尤其是在数字的量化学习
2.4.2.1.1. 挑选某人最可能购买的产品
2.4.2.1.2. 从100万张脸中挑选最匹配的一张
2.4.3. 人类在同一时间内只能把注意力放在少数几件事情上面,而深度学习算法却可以同时处理海量信息,并且发现在大量数据背后的模糊特征之间的关联,这些模糊特征不仅复杂而且微妙,人类往往无法理解,甚至可能不会注意到
2.5. 没有这些外在的人类规则,深度学习的效果其实会更好
2.6. 深度学习的训练方法是,针对特定的应用场景,给人工神经网络的输入层“投喂”大量数据样本,同时给输出层“投喂”相应的“正确答案”,通过这样的训练,不断优化人工神经网络的内部参数,使根据输入生成最接近“正确答案”的输出的概率最高
2.6.1. 在训练过程中,可以将深度学习视为解决目标函数最大化问题的一种数学运算
2.6.2. 目标函数是由每次的训练主题决定的
2.7. 人工神经网络的训练是一个数学处理过程
2.7.1. 通过不断调整网络中的数百万个参数(有时甚至是数十亿个参数),来最大限度地提高“只要输入有猫的图片,就输出‘有猫’的判定”的概率,以及“只要输入没有猫的图片,就输出‘无猫’的判定”的概率
2.8. 深度学习几乎在任何领域都能发挥识别、预测、分类、合成的作用
2.9. 在借助大量数据进行训练时,深度学习可以针对每一个用户提供定制化的服务——基于海量数据中较相似用户的数据,对每个用户做出贴切的预测,以达到千人千面的效果
3. 人脑和AI“脑”的差别和擅长
3.1. 深度学习的能力非常强大,然而它并不是“包治百病”的灵丹妙药
3.1.1. 不具备人类在面对决策时独一无二的汲取过去的经验、使用抽象概念和常识的能力
3.2. 与人类相比,深度学习想要充分发挥作用,离不开海量的相关数据、单一领域的应用场景以及明确的目标函数
3.2.1. 这三项缺一不可,如果缺少其中任何一项,深度学习将无用武之地
3.2.2. 如果数据太少,AI算法就没有足够多的样本去洞察数据背后的模糊特征之间的有意义的关联
3.2.3. 如果问题涉及多个领域,AI算法就无法周全考虑不同领域之间的关联,也无法获得足够的数据来覆盖跨领域多因素排列组合的所有可能性
3.2.4. 如果目标函数太过宽泛,AI算法就缺乏明确的方向,以至于很难进一步优化模型的性能
3.3. 图
