网络机器人吧社区

人工智能、机器学习和深度学习有什么区别?

GeoTalks 2019-02-10 15:31:53

作者 | Long-time tech

记者 | Michael Copeland

原文 | The Difference Between AI, 

         Machine Learning, and Deep 

         Learning?  NVIDIA Blog

译者 | 曲晓峰      授权发布   

首发 | 将门创投   

改编 | GeoTalks



人工智能是未来;

人工智能是科幻;

人工智能是我们日常生活的一部分。


这些评价可以说都正确,就看你说的是哪一种人工智能(AI)。


今年早些时候,Google DeepMind 的 AlphaGo 打败了韩国的围棋大师李世石九段。在媒体描述 DeepMind 的胜利的时候,人工智能(AI)、机器学习(machine learning)和深度学习(deep learning)都用上了。这三者在 AlphaGo 击败李世乭的过程中都起了作用,但它们指的并不是同一个东西


说清它们之间的关系,最简单的方法就是,用同心圆可视化地展现出来:


首先,人工智能是最早出现的,也是最大,最外侧的同心圆;

其次,是机器学习,稍晚一点;

最内侧,是深度学习,当今人工智能大爆炸的核心驱动。


图1 五十年代,人工智能曾经极为乐观。之后,人工智能的一些较小的子集发展了起来。先是机器学习,然后是深度学习。深度学习又是机器学习的子集。深度学习造成了前所未有的巨大的影响。



从概念的提出到走向繁荣


1956 年,几个计算机科学家相聚在达特茅斯会议,提出了人工智能。其后,人工智能就一直萦绕于人们的脑海之中,并在科研实验室中慢慢孵化。之后的几十年,人工智能一直在两极反转:或者是我们文明耀眼未来的预言,或者被当成技术疯子的狂想扔到垃圾堆里。坦白说,直到 2012 年之前,还真的两者都有点。


过去几年,尤其是 2015 年以来,人工智能大爆发。很大一部分是由于 GPU(英文Graphic Processing Unit的缩写,意为“图形处理器”) 的广泛应用,使得并行计算变得更快、更便宜、更有效。当然,也是由于无限拓展的存储能力和骤然爆发的数据洪流(大数据)的组合拳,使得图像数据、文本数据、交易数据、映射数据,无不海量爆发。


让我们慢慢梳理一下计算机科学家们是如何将人工智能从最早的一点点苗头,发展到能够支撑那些每天被数亿用户使用的应用的。



人工智能(Artificial Intelligence) 

—— 为机器赋予人的智能


图2 成王(King me): 能下国际跳棋的程序是早期人工智能的一个典型应用,在1950年代曾掀起一阵风潮。(译者注:国际跳棋棋子到达底线位置后,可以成王,成王棋子可以向后移动)。


早在1956年夏天那次会议上,人工智能的先驱们,就梦想着用当时刚刚出现的计算机来构造复杂的、拥有与人类智慧同样本质特性的机器。这就是我现在称为“通用人工智能”(General AI)或者说“强人工智能”。


通用人工智能有着我们所有的感知(甚至比人更多)、我们所有的理性,它像我们一样思考的,是无所不能的机器。人们在电影里也总是看到这样的机器,友好的,像星球大战中的 C-3PO;邪恶的,如终结者。


通用人工智能现在还只存在于电影和科幻小说中,原因不难理解,我们还没法实现它们,至少目前还不行。


我们能实现的,一般称为“弱人工智能”(Narrow AI)。弱人工智能是指能够与人一样,甚至比人更好地执行特定任务的技术。弱人工智能的例子,例如,像 Pinterest 上的图像分类,或者 Facebook 的人脸识别。


这些是弱人工智能在实践中的例子。这些技术实现的是人类智能的一些具体的局部。


弱人工智能,如何实现?从何而来?这就客观地把我们引到了同心圆里面一层——机器学习。




机器学习 —— 

一种实现人工智能的方法


健康食谱(Spam free diet):机器学习能够帮你过滤电子信箱里的(大部分)垃圾邮件。(译者注:英文中垃圾邮件的单词 spam 来源于二战中美国曾大量援助英国的午餐肉品牌 SPAM。直到1960年代,英国的农业一直没有从二战的损失中恢复,因而从美国大量进口了这种廉价的罐头肉制品。据传闻不甚好吃但充斥市场。)


机器学习最基本的做法,是使用算法来解析数据,从中学习,然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务,硬编码的软件程序不同,机器学习是用大量的数据来“训练”,由各种算法从数据中学习如何完成任务。


机器学习直接来源于早期的人工智能领域。传统算法包括决策树学习、推导逻辑规划、聚类、强化学习和贝叶斯网络,等等。众所周知,我们还没有实现通用人工智能。早期机器学习方法甚至都无法实现弱人工智能。


机器学习最成功的应用领域是计算机视觉,虽然也还是需要大量的手工编码来完成工作。


人们需要手工编写分类器、边缘检测滤波器,以便让程序能识别物体从哪里开始,到哪里结束;写形状检测程序来判断检测对象是不是有八条边;写分类器来识别字母“S-T-O-P”。使用以上这些手工编写的分类器,人们总算可以开发算法,来感知图像,判断图像是不是一个停止标志牌。


图3 停止标志牌

这个结果还算不错,但并不是那种能让人为之一振的成功。特别是遇到云雾天,标志牌变得不是那么清晰可见,又或者被树遮挡一部分,算法就难以成功了。这就是为什么,前一段时间,计算机视觉的性能一直无法接近到人的能力。它太僵化,太容易受环境条件的干扰。


随着时间的推进,学习算法的发展改变了一切。




深度学习 —— 

一种实现机器学习的技术


图4 放猫(Herding Cats): 从 YouTube 视频里面寻找猫的图片是深度学习杰出性能的首次展现。(译者注:herding cats 英语习语,照顾一群喜欢自由,不喜欢驯服的猫,用来形容局面混乱,任务难以完成。)


人工神经网络(Artificial Neural Networks)是早期机器学习中的一个重要的算法,历经数十年风风雨雨。神经网络的原理是受我们大脑的生理结构、互相交叉相连的神经元的启发。但与大脑中一个神经元可以连接一定距离内的任意神经元不同,人工神经网络具有离散的层、连接以及数据传播的方向。


例如,可以把一幅图像切分成图像块,输入到神经网络的第一层。在第一层的每一个神经元都把数据传递到第二层。第二层的神经元也是完成类似的工作,把数据传递到第三层,以此类推,直到最后一层,然后生成结果。


每一个神经元都为它的输入分配权重,这个权重的正确与否与其执行的任务直接相关。最终的输出由这些权重加总来决定。


仍以停止(Stop)标志牌为例。一个停止标志牌图像的所有元素都被打碎,然后用神经元进行“检查”,八边形的外形、救火车般的红颜色、鲜明突出的字母、交通标志的典型尺寸和静止不动运动特性,等等。


神经网络的任务就是给出结论,它到底是不是一个停止标志牌。神经网络会根据所有权重,给出一个“概率向量”,一个经过深思熟虑的猜测。这个例子里,系统可能会给出这样的结果: 86% 可能是一个停止标志牌;7% 的可能是一个限速标志牌;5% 的可能是一个风筝挂在树上,等等。然后网络结构告知神经网络,它的结论是否正确。


即使是这个例子,也算是比较超前了。直到前不久,神经网络也还是为人工智能圈所淡忘。人工智能出现的早期,神经网络就已经存在了,神经网络对于“智能”的贡献微乎其微。


主要问题是,即使是最基本的神经网络,也需要大量的运算。神经网络算法的运算需求难以得到满足。不过,还是有一些虔诚的研究团队,以多伦多大学的Geoffrey Hinton为代表,坚持研究,实现了以超算为目标的并行算法的运行与概念证明。但也直到 GPU 得到广泛应用,这些努力才见到成效。


我们回过头来看这个停止标志识别的例子。神经网络是调制、训练出来的,时不时还是很容易出错的。它最需要的,就是训练。需要成百上千甚至几百万张图像来训练,直到神经元的输入的权值都被调制得十分精确,无论是有雾还是没有,天晴还是下雨,每次都能得到正确的结果。


只有这个时候,才可以说神经网络成功地自学习到一个停止标志的样子;在 Facebook 的应用里,就是神经网络自学了你母亲的脸;又或者是神经网络学习到猫的样子,就像吴恩达教授 2012年在Google实现的那样。


吴教授的突破在于把这些神经网络,从基础上显著地增大了。层数非常多,神经元也非常多,然后给系统输入海量的数据,来训练网络。在吴教授这里,数据是一千万YouTube视频中的图像。吴教授为深度学习(deep learning)加入了“深度”(deep)。这里的“深度”就是说神经网络中众多的层。


现在,经过深度学习训练的图像识别,在一些场景中甚至可以比人做得更好,从识别猫,到辨别血液中癌症的早期成分,再到识别核磁共振成像中的肿瘤。Google的AlphaGo先是学会了如何下围棋,然后与它自己下棋训练。它训练自己神经网络的方法,就是不断地与自己下棋,反复地下,永不停歇。



深度学习,给人工智能以璀璨的未来


深度学习使得机器学习能够实现众多的应用,并拓展了人工智能的领域范围。深度学习摧枯拉朽般地实现了各种任务,使得似乎所有的机器辅助功能都变为可能。无人驾驶汽车、预防性医疗保健,甚至是更好电影的推荐,都近在眼前,或者即将实现。


人工智能就在现在,就在明天。有了深度学习,人工智能甚至可以达到我们畅想的科幻小说一般。你的C-3PO我拿走了,你有你的终结者就好了。



源于https://zhuanlan.zhihu.com/p/30168291(题图和图3除外),绿色文字由GeoTalks补充。感谢曲老师与GeoTalks读者分享。曲晓峰,清华大学深圳研究生院,博士后,现居香港。

Copyright © 网络机器人吧社区@2017