网络机器人吧社区

猎奇 一文讲清人工智能、机器学习和深度学习的区别

积木拼图 2019-01-10 16:58:26

原文来自 blogs.nvidia

作者:Micheal Copeland

翻译:小羊



还记得年初的那场人机大战么,在描述谷歌 DeepMind 的 AlphaGo是如何击败李世石时,媒体们纷纷用到了人工智能机器学习深度学习这三个术语。不过,这三者并不是一回事。



要给大家解释三者间关系,用最直观的方式就是下面的这组同心圆(方)——最外层是人工智能(AI)——中间是后来兴起机器学习(Machine Learning)——最里层就是促使当下人工智能大爆发的深度学习(Deep Learning)。




从萧条到繁荣


1956 年,几个计算机科学家在达特茅斯会议上,首次提出“人工智能”的概念。从那时起,人工智能就在科研实验室中慢慢孵化。在过去的几十年里,人工智能一直处于两个舆论极端——一会儿被誉为人类文明通往美好未来的关键,一会儿又被称作了疯狂科学家的妄想。事实上,直到 2012 年,这两种声音还同时存在。


在过去的几年,尤其从 2015 年开始,人工智能开始大爆发。这很大程度上关乎了GPU的广泛应用,得并行处理更快、更便宜、更强大。当然,无限拓展的存储能力与骤然爆发的数据洪流(大数据)的组合,也使得图像数据、文本数据、交易数据、映射数据全面海量爆发。


让我们从头梳理一遍,计算机科学家是怎样将人工智能从萧条一步步发展到被如今这样——成千上万人使用着基于人工智能的应用这一盛况的。


人工智能——为机器赋予的人类智能



King me:早在上个世纪 50 年代,会下西洋棋的计算机程序便造成过一时的轰动


让我们继续回到 1956 年夏天的那场会议。那时,人工智能先驱们的梦想是使用新兴计算机造出具有人类智力的复杂机器。这就是“通用人工智能”(General AI)的概念——人工智能可以拥有甚至比人类更多的感觉、人类的理智,并能像人类一样思考。


你应该已经在电影中见过很多次人工智能了,有的作为人类的朋友,比如《星球大战》中的 C-3PO ,有的则是人类敌人,比如终结者。目前,通用人工智能还仅存在于各类电影和科幻小说中,我们还无法实现它,至少现在不行。


那我们能实现的有哪些呢?这里要提到一个叫做“弱人工智能”(Narrow AI)的概念了。弱人工智能是指能将特定任务处理得和人类一样好,甚至更好的技术。关于弱人工智能的相关例子就很多了,比如 Pinterest 上的图像分类,Facebook的人脸识别等等。


这些已在实践中使用到的弱人工智能,展示出了人类智能的某一些方面。但它们是如何做到的?“智能”又是怎么来的?接下来我们来看第二个同心圆(方),“机器学习”(Machine Learning)。


机器学习——实现人工智能的一种方式


Spam free diet:机器学习能帮你过滤收件箱中的大部分垃圾邮件


机器学习的基本原理是运用算法来分析数据、从中学习,从而对真实世界中发生的事件做出决策或预测。不同于那些需要手动敲代码、输入指令来完成特定功能的程序,机器学习会通过海量大数据和算法来不断“训练”自己,并从中学习如何完成任务。


机器学习直接来源于早期的人工智能领域。传统算法包括了决策树学习(decision tree learning)、归纳逻辑编程(inductive logic programming)、聚类(clustering)、强化学习(reinforcement learning)和贝叶斯网络(Bayesian networks)等。不过人们现在还没能实现强人工智能,早期机器学习方法甚至都无法实现弱人工智能。


事实证明,机器学习的最佳应用领域是计算机视觉,尽管它还是需要大量手工编码来完成工作。人们需要编码一些分类器,比如边缘检测过滤器(edge detection filters)让程序识别对象的启止位置;形状检测(shape detection)来判断它是否有八条边;还有用来识别单词“S-T-O-P”的分类器。有了这些手工编写的分类器,人们才可以开发出能感知图像、判断图像否为“停止标志牌“的算法。


这是结果不错,但还不够好。比如遇上大雾天气,或是当标志牌被树枝遮挡住一部分时,它很可能会失灵。这就是为什么在之前很长一段时间里,计算机的视觉和图像检测功都无法媲美人类——它太容易受环境条件干扰了。


然而随着时间的推移,学习算法的发展改变了一切。


深度学习——一种实现机器学习的技术



Herding cats:从YouTube视频中挑出小猫图片,是深度学习的第一次重大突破


另一种源自早期机器学习的算法——人工神经网络(Artificial Neural Networks),已有几十年的历史。神经网络的灵感来源于大脑的生理结构——互相交叉相连的神经元。但与大脑中一个神经元可以连接一定距离内的任意神经元不同,人工神经网络具有离散的层、连接和数据传播的方向。


比如,我们把一个图像切分成小块,输入到神经网络的第一层中,然后第一层的单个神经元们将数据传递给第二层,第二层的神经元将数据传给第三层,如此传递直到最后一层,然后输出最终结果。


每个神经元都会分配一个权重给它的输入——来评估所执行的任务是否正确。最终的输出由这些权重加总来确定。

 

让我们回到先前“停止标志牌”的例子。将停止标志牌的图像切分成小块,交给神经元“检测”——它独特的八边形形状、火红的色彩、独特的字母、契合交通标志牌的大小以及和它是否有因运动带来的缺失。


神经网络的任务是判定这是否为一个停止标志。神经网络会根据所有权重,给出一个经过深思熟虑的猜测——“概率向量”。


在这个例子中,系统有大概有86%的把握认为图像是一个停止标志牌,7% 的把握认为这是一个限速标志,5% 的把握认为这是一只被卡在树上的风筝等等——这时再由网络架构告诉神经网络,它给出的结果的是否正确。


其实这个例子也有些超前,直到前不久,神经网络都是被人工智能圈避开的。人们从人工智能早期就一直在做这方面的研究,但它并没有贡献出太多“智能”。主要问题在于,即使是最基本的神经网络,也需要大量的运算。神经网络算法的运算需求难以得到满足。


不过,由多伦多大学的Geoffrey Hinton带领的研究小组一直在继续相关研究工作,最终实现了以超算为目标的并行算法的运行与概念证明。但也是在GPU得到广泛应用后,这些努力才终见成效。


我们再次回到“停止标志牌”的例子,当神经网络在“训练”时得到错误答案,这其实是非常好的机会。它最需要的就是训练,需要成千上万甚至数以百万计的图像来训练,直到神经元的输入权值被精确调整。这样不管有雾没雾,晴天雨天,它都可以得到正确的结果。


这个时候,我们才能说神经网络成功自学到识别一个停止标志了。就像Facebook 里,使用神经网络成功识别出你妈妈的脸;或者吴恩达(Andrew Ng)教授2012年在谷歌实现了神经网络学习识别到小猫的图片。


吴教授的突破在于他从根本上使用了这些神经网络,并通过增加层数和神经元的数量使它们显著增大,然后用大量的数据来训练它们。吴教授使用的数据是一千万个YouTube视频中的图像。他把“深度”(deep)加入到“深度学习(deep learning)”中,这这里的“深度”就是指神经网络中众多的层。

 

如今经过深度学习训练后的图像识别,在一些场景中甚至比人类做的更好。识别范围之广,从识别视频中的小猫图像,到识别血液中的癌细胞留下的蛛丝马迹,或是核磁共振显像中的肿瘤。谷歌的AlphaGo也是先学会了打简单的电脑游戏,然后被训练下围棋——通过反复与自己下棋,不断训练自己的神经网络。


感谢深度学习,让人工智能有一个光明的未来


深度学习使得机器学习能够实现众多的应用,并拓展了人工智能的领域范围。深度学习将任务分解,使得似乎所有的机器辅助功能都变为可能。无人驾驶,预防性医疗保健,甚至电影推荐,都近在眼前。


人工智能是现在,更是未来。有了深度学习,人工智能甚至能帮助我们实现那些科幻小说中的场景。你的C-3PO我拿走了,你有你的终结者就好了。


【延伸阅读】

AlphaGo你竟然是这样一个会打游戏的宝宝





PINTEC集团旗下子品牌

读秒 | 璇玑 | 积木盒子 | 虹点基金 | 企乐汇 | 麦芬保险


Copyright © 网络机器人吧社区@2017