区块链与分布式机器学习(DML)关系浅谈

分布式协作是未来的方向,其基础是分布式业务共识。分布式业务共识实质上是,在共识算法的支配下借助分布式智能系统来完成每个节点特定的任务。虚拟机(VM)就是一个典型的分布式智能系统,或...
分布式协作是未来的方向,其基础是分布式业务共识。分布式业务共识实质上是,在共识算法的支配下借助分布式智能系统来完成每个节点特定的任务。虚拟机(VM)就是一个典型的分布式智能系统,或者说是分布式AI的低级形式。分布在全网上的各个节点通过与VM的直接交互,来达到交易的目的。VM执行交易的机制是预先得到全网共识的智能合约(代码库),这是在一个行业生态中较为简单的业务共识。VM运行的方式是通过执行一套对应的算法,完成具体的链上交易任务。但是,EVM(以太坊虚拟机)目前还不能做到专家系统,如不能够给出股票投资策略专家级建议,只能够完成股票交易操作指令的执行,因此是不具备智能形态的。目前区块链所起的作用是通过业务共识来达成自动交易,并同步交易信息,节约交易者时间,数据不可篡改,具有抗抵赖性和方便追责,同时降低资本市场穿透式监管的成本。但是区块链有以下缺陷:(1)数据来源的真实性依然要借助于中心化的平台进行背书,例如股票交易数据的真实性依然要借助中心化的传统证交所,所以并不能彻底解决节点间的信任问题;(2)仅仅能够做数据留痕,不能利用数据进行系统训练,以更好地改进业务质量。有鉴于此我们认为区块链未来的技术方向是跟AI技术相结合,其中最典型的是区块链+分布式机器学习的综合技术模式。

训练专家系统是机器学习(ML)的任务,简单来说,ML工作所需数据是真实训练数据和最新预测数据,通过这些数据的对比不断调整权值向量和学习参数,以提高ML预测的精度。这些训练数据并不是全都有用,AI需要从中挖掘出有价值的数据,并发现这些数据之间的关联性,因此数据挖掘技术和ML是一体两翼。进入到金融大数据时代,每秒钟产生的数据量在传统基础上暴增,并且所构建的模型需求也相对传统有了质的提升,比如微软公司在2015年训练出的AI模型LightLDV,拥有多达200亿个参数。数据的量越来越大,关系越来越复杂,也对模型的复杂度提出了超高要求,这使得单机进行ML训练的效率无法跟上,因此未来分布式机器学习(DML)就成为了趋势。

DML需要借助云计算、大数据挖掘、机器学习等技术作为支撑,同时区块链技术在其中也扮演着重要角色。举例:股票市场的投资者的基本诉求是在控制风险的基础上,尽可能多地增加收益。那么如果有这么一个专家系统,经过训练,可以对未来的收益和风险进行较准确的预测,股民就可以根据专家系统的建议,灵活选择不同的投资品种进行组合。而训练专家系统的数据来自股民自己的历史数据,和真实的预测数据。因为可以对AI进行训练,因此这些数据都是有价值的。可以设计一套机制,股民贡献自己的数据上链,可根据数据的价值给与股民节点相应的token奖励。分布式专家系统(或者AI投顾系统)的初衷是帮助大部分节点获益,因此token可以与系统总的盈利能力的改进相绑定。DML在每个节点处都有最新的备份,且永久存在链上。只有区块链能够实现这一套激励机制,这就大大加快了AI专家系统学习的步伐跟效率。

有两点机制可以确保原始数据是真实的:(1)从利益角度出发,每个节点都想减少风险和提高系统预测能力,因此会贡献出真实数据以帮助DML能力的快速提升;(2)真实数据是完全随机性的,而造假的数据或多或少有一些非随机的痕迹,这一点可以核实出来,系统自动舍弃掉非随机的成分,因此使得造假的部分不能作为训练数据。

区块链创立的初衷是节点间的民主、共责、共识、信任,其实还应该在这些基础上加上“激励”。激励必然跟钱挂钩,而区块链的特性已经解决了双花问题,这使得去中心化的激励机制是可行的。区块链网络共同维护的是一个虚拟的分布式机器,是信任的机器。区块链+DML的模式在资本市场上的成功也必然延伸到其他场景,代表了区块链的真正价值——即“实现高效有序的大规模分布式协作”。

相关文章