网络机器人吧社区

DeepMind 让计算“做梦”改善机器学习(附论文下载)

新智元 2018-12-05 11:04:56

1新智元编译

来源:bloomberg.com

译者:徐红

新智元启动新一轮大招聘:COO、执行总编、主编、高级编译、主笔、运营总监、客户经理、咨询总监、行政助理等 9 大岗位全面开放。 

简历投递:jobs@aiera.com.cn

HR 微信:13552313024

新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界平均水平的工资和奖金。

加盟新智元,与人工智能业界领袖携手改变世界。


【新智元导读】在通用人工智能的研究上,DeepMind一直在努力。科幻小说家Philip Dick曾在他的经典小说中提到,机器人不太可能会做梦。但DeepMind最新研发出的人工智能系统却实现了机器人做梦,并且成功完成在迷宫中找到苹果的任务【进入新智元微信公众号,在对话框输入1120下载论文】


 

DeepMind11月17日发表论文,其机器学习系统的速度和性能上实现了飞跃。最新的人工智能系统至少在比喻的意义上能够做梦。


科幻小说家Philip Dick曾在他的经典小说中提到,机器人不太可能会做梦。但Google旗下公司DeepMind最新研发出的人工智能系统却实现了机器人做梦,这款人工智能系统成功完成了在迷宫中找到苹果的任务。




DeepMind研究人员本周四发布的一篇文章中提到,这一成果使他们的机器学习系统在速度和性能上有了质的飞跃。系统成功嵌入了类似于动物做梦的功能属性。


新系统名为无监督式加强辅助学习机制(UnsupervisedReinforcement and Auxiliary Learning agent)或Unreal的新系统,能够很快学会三维迷宫游戏Labyrinth的玩法,速度比现在最高级的AI软件还要快10倍,其水平已经达到人类玩家的87%。 DeepMind研究人员还表示,该系统训练速度快、效率高,其数据有效性也很高。并且缩短了训练时间,可以更快地尝试新的玩法。


苹果迷宫


游戏采用DeepMind研发的游戏环境Labyrinth,设计采用的是非常有名的视频游戏系列Quake风格。游戏中的机器在迷宫中导航路线,收集路线上遇到的苹果得分。


这种类型的游戏是人工智能研究的重要领域,比如游戏中得分机率的设定。研究人员让Unreal在游戏中进行重复操作,集中记录下每次得分的点,这就跟动物做梦是一样的。

研究人员将Unreal的运行标准最大化,而不仅仅是得全分。其中一个必要标准就是视觉环境会随着不同的表现行为而发生改变,这是为了研究行为是怎样影响视觉的。这就跟新生儿学习控制外在环境获得回报是一样的,比如经常暴露在视觉冲击下,如闪亮、多彩的东西,他们就会表现出开心和兴趣。


研究团队中的Jaderberg andMnih在文章中也表示,将Unreal或其他类似的系统应用到实际中还为时尚早。


游戏冠军


从国际象棋到像美国Jeopardy那样的问答类竞赛,都在人工智能研究起到了程碑式的重要作用。DeepMind在今年早些时候研发的AlphaGo战胜了围棋世界冠军,成为人工智能领域的一大突破。公司还于月初发布了一款界面,将暴雪公司的科幻视频游戏“星际争霸II”应用到机器学习软件中。星际争霸将是AI研究未来重要的研究目标,因为游戏中的很多场景都非常接近“真实的世界混乱”。Oriol表示,Unreal将致力于提高这款游戏的性能。


游戏高手


DeepMind的Unreal系统还击败了公司现有的所有软件,在Atari公司的57款游戏(包括Breakout)的测试中,Unreal速度更快,得分更高。研究人员表示,Unreal在这些游戏中的表现成绩超过顶级人类玩家880%,而DeepMind原来研制的AI软件只超过了人类玩家的853%。


即使是Montezuma’sRevenge这样最复杂的Atari游戏中,新系统在性能表现方面也实现了更大的飞跃。他们表示,旧的AI系统在游戏中得分是0,而Unreal则获得了3000分的高分,足足比人类顶级玩家的最好成绩还要高出一半。


原文链接:https://www.bloomberg.com/news/articles/2016-11-17/google-deepmind-gives-computer-dreams-to-improve-learning




新智元启动新一轮大招聘:COO、执行总编、主编、高级编译、主笔、运营总监、客户经理、咨询总监、行政助理等 9 大岗位全面开放。 

简历投递:jobs@aiera.com.cn

HR 微信:13552313024

新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界平均水平的工资和奖金。

加盟新智元,与人工智能业界领袖携手改变世界。



 点击阅读原文,查看新智元招聘信息

Copyright © 网络机器人吧社区@2017