区块链这三个字你肯定听过?过去几年区块链曾经是创投领域最火的方向,去中心化的愿景感染了无数理想主义者,但随后围绕区块链产生的种种代币让这项技术变成了骗子们割韭菜的手段,随着2018年币市崩盘,各路为梦想窒息的区块链团队都逐步失去了声音,难道去中心化的区块链技术就真的没有“炒币”之外的价值吗?
近日,联想研究院人工智能实验室AI算力平台团队的论文《基于区块链的分布式模型训练》被区块链基础与应用国际研讨会FAB 2019评选为唯一的“最佳论文”。在技术层面有效地解决数据孤岛问题,通过融合区块链和AI技术提出了基于区块链的分布式模型训练解决方案(BDML)。
BDML是个什么技术?
简单的说,这就是把区块链技术嫁接到人工智能领域的神“脑洞”!
在大数据和深度学习时代,为了充分发挥人工智能模型的性能,需要海量的数据进行训练。但是在很多领域,如政府电子政务,智慧城市,医疗,金融,交通等领域,由于数据的隐私性问题以及缺乏相关的法律法规,造成了数据孤岛,使得深度学习模型的优势无法充分发挥。
以医疗领域为例,中国医疗信息化软件厂家多达几千家,不同厂家、不同系统之间数据无法互联互通。为了更好地保护患者的隐私,以及医疗数据的安全,不同医院之间的数据也很难有效地进行交互。
因此目前医院的数据大多还限制在本院内流通,无法集中多家医院的数据进行大规模研究。在多家医院分别训练出的多个模型,也缺乏有效的方式进行进一步的整合,使得不同医院专家的经验难以有效融合。
在过去,这是一个无解的问题,每家医院都知道通过人工智能能够提高工作效率,但是每家医院又都担心会造成数据泄露或者信息被竞争对手获得。
而联想研究院人工智能实验室则创造性的把区块链技术引入进来,团队设计了一种全新的区块链协议,希望通过这个协议消除各医院对于数据隐私的顾虑,同时又能提升各方合作的动力。
在这个区块链中,参与各方通过区块链协议,共享关于数据的知识而非数据本身,类似比特币中的暴力挖矿也变成了有实际意义的模型训练。区块链协议鼓励参与各方遵守游戏规则,并最终按照各自的贡献获得相应的报酬。BDML技术可以激励多家医院有效整合“孤立”的数据,训练出更好的模型。
这是一次巨大的创新,此前为了解决类似的问题,谷歌提出一个联合学习概念,在分布式训练的基础上,朝解决数据隐私的方向上迈出了一大步,但谷歌的联合训练需要一个服务器作为大家都信任的中间节点,但BDML则没有这样一个中间节点。
这篇论文只是一个开始,人工智能实验室AI算力平台团队希望BDML这项技术,可以帮助营造多个目标一致的社区,在社区内大家通力合作,一起推动技术进步,共同造福人类。