网络机器人吧社区

基于区块链的机器学习市场(下)

币岸两生花 2019-02-10 11:27:10

上半部介绍完安全计算的三种模式计算,下半部重点介绍具体的应用:推荐系统,当前的进展以及留给我们的启示与挑战

终极推荐系统

为了说明私人机器学习的潜力,想象一个名为“终极推荐系统”的应用程序。它会监视您在设备上执行的所有操作:您的浏览记录,您在应用中执行的所有操作,手机上的图片,位置数据,消费记录,可穿戴传感器,短信,家中的相机,未来的相机。然后给你推荐:你应该访问的下一个网站,阅读文章,听歌或购买产品。


这个推荐系统会非常有效。比谷歌,Facebook或其他任何现有的数据孤岛都要多,因为它对你有 最大纵向的看法,它可以从数据中学习,否则这些数据太私人而不能考虑共享。与以前的加密货币交易系统的例子类似,它可以通过允许一个专注于不同领域的模型市场(例如:网站推荐,音乐)来竞争访问您的加密数据并向您推荐某些东西,甚至可能支付给您为您提供数据或您关注所产生的建议。


谷歌的联邦学习和苹果的差异隐私是这种私人机器学习方向迈出的一步,但仍需要信任,不允许用户直接检查其安全性,并保持数据存储。


目前的方法

这很早。很少有组织有任何工作,大多数人都试图一口咬下一块。


来自Algorithmia Research的一个简单结构将模型的精确度设置为高于某个回测阈值:

Numerai目前进一步采取三个步骤:它使用加密数据(尽管不完全同态),它将众包模型结合到元模型中,并根据未来表现(本例中为股票交易一周)奖励模型,而不是通过回溯测试所谓本地复仇令牌计价单位。数据科学家必须将Numeraire作为游戏中的皮肤,激励将会发生的事情(未来的表现),而不是发生的事情(被测试的性能)。但是,它目前集中分发数据,限制感觉是最重要的因素。


没有人为数据创建一个成功的基于区块链的市场。海洋是一个早期尝试勾勒出一个。

还有一些人正在开始构建安全的计算网络。Openminding正在创建一个多方计算网络,用于在Unity之上培训机器学习模型,该网络可以在任何设备上运行,包括游戏控制台(类似于家庭中的Folding),然后扩展以确保MPC的安全。


一个迷人的最终状态将是相互拥有的元模型,它使数据提供者和模型创建者的所有权与他们做出更聪明的决定成比例。这些模型将被标记化,随着时间的推移可以派发股息,甚至可能受到培训者的支配。一种互相拥有的蜂巢式思维。该original Openminding project视频是最接近的建设,这是迄今为止我所看到的。


哪些方法可能首先起作用?

我不会声称知道什么是最好的结构,但我有一些想法。


我用来评估区块链想法的一篇论文是:在物理本地数字原生区块链原生区域,区块链本地越多越好。较少的区块链本地化,引入了更可信的第三方,这增加了复杂性并减少了与其他系统构建模块的易用性。


在这里,我认为这意味着如果创造的价值可以量化,系统就更有可能工作 - 理想情况下直接以金钱形式直接创建,更好的是代币。这允许一个干净的闭环系统。将以前的加密货币交易系统的例子与识别X射线肿瘤的例子进行比较。在后者中,你需要说服一家保险公司X射线模型是有价值的,谈判如何有价值,然后相信一小群身体现在的人来验证模型的成功/失败。


这并不是说对社会用途而言,数字原生的积极总和不会出现。像前面提到的推荐系统可能非常有用。如果附属于管理市场,他们是另一种情况,模型可以采用程序化的方式采取行动,并且系统的回报是代币(在这种情况下来自管理市场),再次创造一个干净的闭环。现在看起来很模糊,但我预计区块链本地任务的领域会随着时间的推移而扩大。


启示

首先,分散式机器学习市场可以消除目前科技巨头的数据垄断。在过去的20年中,他们将互联网上主要的价值创造来源标准化和商品化:专有数据网络和围绕它们的强大网络效应。结果,价值创造从数据转移到算法。

    科技领域的标准化和商品化周期,我们正在接近数据垄断网络时代的结束


换句话说,他们为AI 创建了一个直接的商业模式。喂养和训练它。


其次,他们创造了世界上最强大的AI系统,通过直接的经济激励为他们吸引最好的数据和模型。他们的力量通过多方面的网络效应而增加。随着Web 2.0时代的数据网络垄断变得商品化,它们似乎成为下一个重新聚合点的理想选择。我们可能还有几年的时间,但看起来方向正确。


第三,正如推荐系统的例子所显示的,搜索是颠倒的。产品搜索和竞争 (而不是搜索产品的人)(为了这个框架,向Brad发布信息)。每个人都可能有个人策展市场,推荐系统在竞争中将最相关的内容放入其供稿中,并且相关性由个人定义。


第四,它们使我们能够从Google和Facebook等公司使用的功能强大的基于机器学习的服务中获得同样的好处,而不会泄漏我们的数据。


第五,机器学习可以更快地推进,因为任何工程师都可以访问开放的数据市场,而不仅仅是大型Web 2.0公司的一小部分工程师。

挑战

首先,安全计算方法目前非常缓慢,机器学习的计算成本已经很高。另一方面,对安全计算方法的兴趣已经开始出现,性能也在不断提高。我看到过去6个月内HE,MPC和ZKPs显着性能改进的新方法。


计算为元模型提供的一组特定数据或模型的值很难。清理和格式化众包数据具有挑战性。我们很可能会看到一些工具,标准化和小企业的组合可以解决这个问题。


最后,具有讽刺意味的是,创建这种系统的广义构造的商业模式不如创建个体实例那么明确。这似乎是很多新的加密原语,包括管理市场。


结论

私人机器学习与区块链激励相结合,可以在各种应用中创造出最强大的机器智能。随着时间的推移,可以解决重大的技术挑战。他们的长期潜力是巨大的,并且从大型互联网公司对数据的掌握中受到欢迎。他们也有点可怕 - 他们引导自己存在,自我加强,消费私人数据,并且几乎不可能关闭,这让我怀疑是否创建它们比以前召唤更强大的Moloch。无论如何,它们是加密货币如何缓慢地突然进入每个行业的又一例证。


关注公众号二维码,了解区块链和人工智能最新行业动态:


Copyright © 网络机器人吧社区@2017