网络机器人吧社区

你可能不知道,机器学习的核心竟然是学会忘记

马士兵 2018-11-08 11:31:11

新朋友点击上面的蓝色文字关注

老朋友点击右上角分享到朋友圈


很多人并不知道,机器学习的核心竟然是教会机器学会忘记。

你没看错,就是“忘记”。


人之所以智能,是因为我们有一种能力,只记住需要记住的东西,有些不重要的特征,会自然选择遗忘。


我举个栗子


看下面两张图



你一眼就能看出来,这是同一个人,江疏影


可是,让机器认为这是同一个人,并不是很容易的事儿。

“精确”,是计算机天生的属性,它们会精确的记住每一个信息细节,让机器来认定“相同”,除非在每一个信息上,每一个比特,全部都相等才可以。


要想使它们“忘记”一些不重要的特性,很难。

那是以前


现在有了神经网络,这个网络会自动忽略细节,捕捉重要特征,完全模拟人类的模式来进行图片识别。


补充两个概念吧。


对于一些细节,如果我们的算法关注过头了,叫做“过拟合”,这种情况下,需要让算法进行“忘记”,过拟合是机器的天然属性,算法的调优,在很多时候是消除过拟合。这个并不容易,有很多机器学习的例子都是给定已经清理好的数据,但是,数据的清理,消除噪声,才是消除过拟合的最重要的一步。


有过拟合,就有欠拟合,那就是细节关注不够喽。


下面三个图是同样的数据,分别代表欠拟合/正合适/过拟合



一个过拟合的算法会把“江疏影” 和 “略微变换的江疏影” (姿势/发型稍有变化)

认为不是同一个人,而一个欠拟合的算法会把“江疏影”和“马士兵”认定为同一个人


那么问题就来了,刚才我讲过了“过拟合”产生的原因,那么:


1:“欠拟合”会在什么情况下产生呢?

2:一个中国游客吐了口痰,我们就说“中国人素质差”,这是犯了过拟合的错误还是欠拟合的错误呢?

3:白羊座容易过拟合还是欠拟合?

4:处女座容易过拟合还是欠拟合?


留言吧。


两天后进行神经网络的第二课,时间地点在这里通知,不转发的不给听课资格


老师将继续机器学习的干货分享

目前第一课已经讲完

由于后续课程需要你学习完前面的课程才能继续

需要以前视频的同学按以下步骤操作:

1:右上角分享到朋友圈


2:长按图片 识别二维码 关注马士兵老师的公众号 


3:在公众号直接回复 “神经元” 获得视频链接


Copyright © 网络机器人吧社区@2017