网络机器人吧社区

访谈《机器学习》作者Peter Flach:好莱坞也借AI上头条

图灵访谈 2018-12-05 13:22:25

Peter Flach,布里斯托大学人工智能教授,拥有20多年的机器学习教研经验。在高度结构化的数据挖掘以及通过ROC分析来评估和改进机器学习模型方面,Flach是国际领先的研究人员。他著有Simply Logical: Intelligent Reasoning by Example,也是Machine Learning期刊的总编。曾担任2009年ACM知识发现与数据挖掘国际会议、2012年欧洲机器学习与数据挖掘国际会议的程序委员会共同主席。



《机器学习》是迄今市面上内容最全面的机器学习教材之一,书中汇集了所有用于理解、挖掘和分析数据的先进方法,并且通过数百个精选实例和解说性插图,直观而准确地阐释了这些方法背后的原理,内容涵盖了机器学习的构成要素和机器学习任务、逻辑模型、几何模型、统计模型,以及矩阵分解、ROC分析等时下热点话题。


本书写作思路清楚,逻辑性强。作者首先介绍了机器学习的基础知识,然后提供了大量有价值的结论、对若干机器学习技术性能的洞见,以及许多核心算法的高层伪代码,巧妙地引领读者循序渐进地学习。  


 ——Fernando Berzal,Computing Reviews



电影《机器姬》里,蓝书软件公司CEO——Nathan Bateman利用世界范围内的数据搜索、信息处理来培育人工智能,成功创造了兼具人类外表和思维的机器人Ava。科幻电影有一定的前瞻性,所以机器学习的深入真的能让AI成为现实吗?人工智能是祸还是福?




任何形式的智能,无论人工创造的与否,都要通过经验、和周围环境的互动获得提高发展。的确,机器学习是人工智能领域里重要的一部分,但它还需要比如常识推理、计划等其他的能力。


人工智能的福祸取决于我们如何使用它,对它采取怎样的保障措施。在某些领域,人工智能技能已经取代了人类,所以我们(不能陷入无尽的恐慌之中)而要想办法确保这些人有其他的工作可做。机器人对抗人类、拥有自主追求的想法,目前来讲还不大可能,但人类确实需要考虑如何避免这种情况的发生。如果这只是个有趣的哲学问题就好了!


机器学习在大数据处理方面如何起作用?请给我们简单介绍下。


首先,你要问问自己,搜集到的数据有没有包含足够的信息解决问题。最好把问题简化到几乎可以动手就能解决的程度,然后看看利用这些数据构建的机器学习模型是否可以解决这个简单的问题。如果可以,你再进一步增加问题的难度;如果不可以,就需要搜集更多更好的数据!


语音识别技术是机器研究领域的一个重要方向。在2015年语音识别顶级会议interspeech上,关于鲁棒语音识别领域的识别模型主要基于深层神经网络。这是否意味着信号级别上的语音增强、降噪、过滤已经过时了?


深度学习在语音和图像识别方面非常成功。虽然很强大,但深度学习需要大量的数据支持和高密度地运算。这对人类来说还是个“黑匣子”,我们虽然可以利用它解决一些问题,却不知道如何构建。有些技术比如过滤很容易理解,我们也可以根据使用情况判断技术的重要性。就比如,许多人并不知道汽车的工作原理,却丝毫不影响他的驾车技术;但如果要驾车穿过撒哈拉大沙漠,他就必须了解汽车是如何工作的。


目前人们用来打开“黑匣子”的一个做法是,先训练深层神经网络得到良好的性能,然后根据深层神经的输出结果,训练浅层神经网络或者其他解释性技术,来理解“黑匣子”。


前段时间,AlphaGo和李世乭的围棋对弈很火。您是否可以从机器学习的角度给些建议,比如AlphaGo应对挑战时,如何进行搜索,获得应对走法?在无数的可选走法中,如何做到全局观把握?


在玩儿围棋或者Go这样的游戏时,电脑会通过一个包含所有可行走法的数据树,不仅包括自己的应对走法也充分考虑对手的走法。这个树的所有数据都是AlphaGo自己跟自己对抗时获得的,赛数惊人得大,就算我们一生都在玩围棋也无法完成。这样,它会形成两个深层网络:一个用来计算每种可行走法,一个用来计算每个棋盘位置。这种学习叫作强化学习。在《机器学习》里,我并没有涉及强化学习的内容。假如时间允许,我会考虑在第二版里加入这部分内容。


这次人机大战中机器的胜利会不会鼓励更多的人学习研究机器学习?


我开始系统研究机器的时候,并不是每个人都认为计算机科学是门真正的学科,更别说人工智能、机器学习这些不寻常的领域了。现在,好莱坞电影、人机对战等都加入了这些引人注意的元素,确实是件好事。却也不免充斥着大量的炒作,诱导人们产生不切实际的期望。以学术态度系统地研究机器,追求的是,事物间细微的差别而不是大肆的宣传。当然,越多人研究学习机器对机器学习的发展越好!


您能给机器学习方面的自学者提供些建议吗?他们首先需要做哪些方面的准备?


构思《机器学习》的时候,我有尝试考虑自学者的需要,但他们确实需要一些背景知识方面的准备:一点概率和统计方面的知识,懂点儿逻辑和线性代数。另外,最好还能玩转一些机器学习软件:Python的scikit-learn现在很受欢迎,R和Matlab也提供了很多机器学习库。这些准备让读者了解机器学习能做什么,然后我的书能帮助他们了解机器学习怎么工作。






对话知名作译者,品味精彩技术人生


微信公众号:ituring_interview


长按二维码识别关注我们!


你听得见他们,他们也听得见你!



参加访谈问题有奖征集,图灵赠送电子书

阅读原文
了解查看 图灵社区 更多详情




Copyright © 网络机器人吧社区@2017