网络机器人吧社区

基于区块链的机器学习市场 (上)

币岸两生花 2018-12-05 15:23:55

通过基于区块链市场的数据训练的机器学习模型有可能创造出世界上最强大的人工智能。它们结合了两个强大的原始设备:私人机器学习,允许在不透露敏感私人数据的情况下进行培训,以及基于区块链的激励机制,这些激励机制允许这些系统吸引最佳数据和模型,使其变得更加智能。其结果是开放的市场,任何人都可以出售他们的数据 保持其数据的私密性,而开发人员则可以使用激励措施为他们的算法吸引最佳数据。


构建这些系统具有挑战性,必要的构建块仍在创建中,但简单的初始版本看起来已经开始变得可能。我相信这些市场将使我们摆脱当前Web 2.0数据垄断时代,进入数据和算法公开竞争的Web 3.0时代,两者都是直接货币化的。


起源

这个想法的基础是在2015年与理查德· 努梅莱的谈话。Numerai是一家对冲基金,它将加密的市场数据发送给任何想要竞争模拟股市的数据科学家。Numerai将最好的模型提交结合到一个“ 元模型 ”中,交易了元模型,并支付模型表现良好的数据科学家。


让数据科学家参与竞争似乎是一个强大的想法 所以这让我想到:你能创建一个完全分散的版本的这个系统,可以推广到任何问题吗?我相信答案是肯定的。


施工

作为一个例子,我们尝试创建一个完全分散的系统,用于在分散交易所交易加密货币。这是许多潜在的建筑之一:

    

    数据数据提供者可以获取数据并将其提供给建模人员。


模型构建建模者选择要使用的数据并创建模型。培训是使用安全的计算方法完成的,该方法允许模型在不暴露底层数据的情况下进行培训。模型也被放样。


元模型构建元模型是基于考虑每个模型的放样的算法创建的。

创建元模型是可选的 - 您可以想象使用的模型不会被合并到元模型中。


使用元模型智能合约通过分散交换机制在链上以编程方式进行元模型和交易。


分配收益/损失经过一段时间后,交易产生利润或亏损。这种利润或损失是根据元模型的贡献者分成多少,这取决于他们制作多少智能元素。负面贡献的模型有部分或全部资金被采纳。然后,模型转向并对其数据提供者执行类似的分发/股权削减。


可验证的计算每个步骤的计算或者是集中式的,但可以使用像Truebit这样的验证游戏进行验证和挑战,或者使用安全的多方计算进行分散。


托管数据和模型要么托管在IPFS上,要么托管在安全的多方计算网络中,因为链上存储将会太昂贵。

是什么让这个系统强大?

吸引全球最佳数据的激励措施吸引数据的激励措施是系统中最有效的部分,因为数据往往成为大多数机器学习的限制因素。以同样的方式,比特币通过开放式激励机制创建了一个全球计算能力最强的紧急系统,适当设计的数据激励结构将为您的应用程序带来世界上最好的数据。关闭数据来自数千甚至数百万来源的系统几乎是不可能的。


算法之间的竞争在以前不存在的地方创建模型/算法之间的公开竞争。使用数千种竞争新闻源算法来分散Facebook。


奖励透明度数据和模型提供商可以看到他们获得了他们提交的公平价值,因为所有计算都是可验证的,使他们更有可能参与。


自动化在链上直接生成值并在令牌中直接生成值创建了一个自动化的,不受信任的闭环。


网络效应的用户,数据提供者和数据科学家多面的网络效应使系统自我强化。它的表现越好,吸引的资金就越多,这意味着更多的潜在支出,这吸引了更多的数据提供者和数据科学家,他们使系统变得更加智能,反过来吸引更多的资本,并且又回到了原来的位置。


隐私

除了以上几点,一个主要特点是隐私。它允许1)人们提交数据,否则这些数据太私密而无法共享,2)阻止数据和模型的经济价值泄漏。如果在未公开的情况下保持未加密,则数据和模型将被免费复制,并由尚未提供任何工作的其他人使用(“免费搭车者”问题)。


对搭便车问题的部分解决方案是私下出售数据。即使买家选择转售或发布数据,其价值随时间而衰退。但是,这种方法限制了我们的短期使用情况,并且仍然会产生典型的隐私问题。因此,更复杂但功能更强大的方法是使用安全计算形式。


安全计算

安全的计算方法允许模型在数据上进行训练而不会泄露数据本身。目前使用和研究的安全计算有三种主要形式:同态加密(HE),安全 多方计算(MPC)和零知识证明(ZKPs)。多方计算是最常用的专用机器学习的那一刻,作为同态加密往往过于缓慢,这不是明显的如何ZKPs适用于机器学习。安全计算方法正处于计算机科学研究的前沿。它们通常比常规计算慢几个数量级,是系统的主要瓶颈,但近年来一直在改进。 (未完待续)


关注公众号二维码,了解区块链与人工智能最新动向:




Copyright © 网络机器人吧社区@2017