网络机器人吧社区

【问答】什么是机器学习?

Tizen在路上 2019-01-10 16:37:52

阅读建议

字数:~1800

关键词:机器学习 AlphaGo 强化学习

阅读时长:8分钟

开始悦读


近期由于工作需要,参加了一些业内大牛主讲的机器学习培训班,收益颇丰。为了让非计算机专业的朋友也能了解机器学习,在此我将用最朴实简洁的语言将知识点整理成一篇文章和大家分享。


首先我们需要理解“机器学习”这个词的含义。它的定义是:通过计算机寻找一种数学模型,让这种模型符合它所需要描述的对象。这可能比较抽象,给大家举个例子:比如大家都耳熟能详的AlphaGo,它所需要描述的对象是下围棋,为此科学家需要寻找一种算法(模型)来告诉机器该如何判断走哪一步才会赢。


这里再展开讲一下我自己对机器学习的理解。小时候我们总听老师家长们说,去学校读书,学知识是一方面,更重要的是掌握学习的方法。这里“学习的方法”正是一种数学模型,我们一旦掌握了之后便能举一反三以此来学习更多的新知识。机器学习也是如此,人类正尝试着把我们描述定义世间万物的方法传授给电脑。


人类学习的能力自古就有。最近在看霍金的《时间简史》,里面有一个例子很形象地描述了“”人肉学习“”的过程:几百年前的人们想要寻找一种能够描述太阳系中各行星运动轨迹的模型,一旦这个模型符合太阳系行星的运动情况,我们便可以预测未来某个时刻某个行星的位置及速度等属性。比如哈雷就成功预测了哈雷彗星在未来回到人们视野中的时间,这颗彗星也因此以他命名。



在这个模型中不同行星的运动速度,长短轴半径和周期不同,这些数据被称为模型的参数。然而要得到这些参数就要根据观察到的历史数据计算。开普勒一辈子做的事情大致分为两件,前半生跟着老师第谷观测得到数据,后半生做“人肉学习”——找到模型的参数,让他所预测的行星运动轨迹符合所观察到的真实情况,即证实模型是否能描述客观对象。这样的人肉学习虽然耗时很长(建立不同模型所需要的时间不同,预测行星算是一个比较极端的例子),但是从原理上来讲和机器学习是一样一样的。开普勒花了半辈子做的工作,如今的计算机只需要万分之一秒都不到就能完成。机器学习的过程其实就是从一堆数据中,计算出一个合理的模型。


解释完机器学习的概念后就能展开说机器学习的方法了。根据使用数据的类型不同可分为两种:有监督的学习和无监督的学习。区别在于数据的标注与否。还是举刚才行星的例子,如果我们给计算机的数据只是每天晚上的星图,不人工标注每颗行星的名字,让计算机自己找出每颗行星运动的轨迹,这就是无监督的学习。反过来如果我们人工标注好每张图上每颗行星的名称,再让计算机学习,就是有监督的学习。可以简单理解为,你在学习的时候有没有老师给你敲黑板划重点。这两种方法各自的优缺点也是显而易见的,有监督的学习需要投入大量人的时间和精力,导致有效的数据量比较小,成本也高,但算出的模型相对比较准确。无监督的学习很容易获得大量的数据,但得到的模型可能不准确,毕竟是计算机自己在杂乱无章的数据里找方向。



大家所熟知的AlphaGo一开始使用的是有监督的学习,即学习人类的几十万盘高手对弈的棋谱,这些棋谱的套路和输赢是已知的。李世石和柯洁刚开始接触围棋的时候也是跟着棋谱学,只是他们一生所学不过几千盘,不抵AlphaGo的1%,所以AlphaGo大获全胜是有理有据的。但是如果一直使用有监督的学习,恐怕AlphaGo的水平也就受制于此了。毕竟跟10段旗手学习的最高水平也就是超过10段一点点,因为人类没走过的棋法机器是学不到的(找一个好老师的重要性)。如果用无监督的学习似乎也不可行,因为对围棋来说,如果按照每一步去遍历试错,这个次数将是天文数字(大家应该听说过往棋盘上放米粒的故事)。因此AlphaGo采用的是另一种学习方法:强化学习。


强化学习可以简单地理解为引入了反馈。也就是说,机器先试着往一个方向走,然后会得到反馈这个方向正确与否,以此为引导进行学习。对于AlphaGo来说,这个“引导”必然不是人类,而是由谷歌团队开发出来的一个程序,它能大致计算棋盘上的胜率。当AlphaGo走完若干步后,该程序能判断胜率有所提升还是下降,相对应的给AlphaGo以反馈,逐渐引导AlphaGo往胜率高的方向走。在这个过程中,不仅有效避免了大量的盲目试错,也尝试了人类没有走过的棋法,可以说是一石二鸟。



回到具体的工作内容上,最近我正在参与研发一个用于分析3GPP测试数据的模型。它先利用历史数据进行有监督的学习,然后对未来性能的提升进行预测。每当一次代码提交后比较实际提升的效果和预测结果,对模型进行改进和修正。如果有对机器学习感兴趣的朋友欢迎给我留言讨论!




(图片均来自网络)


 • end • 



推荐阅读

【问答】互联网真的是免费的吗?

【问答】要不要出国留学?




Copyright © 网络机器人吧社区@2017