其他分享
首页 > 其他分享> > 大数据时代如何通过区块链保证数据的稀缺性?

大数据时代如何通过区块链保证数据的稀缺性?

作者:互联网

作者:白硕

作者介绍:白硕,恒生研究院院长

在区块链以及自然语言处理、知识图谱等人工智能领域有深厚的造诣,在语言学、哲学方面也有深入研究,注重学科交叉与融会贯通。

数据被称为数字化时代的金矿,是基础战略资源,也是企业的核心资产。互联网平台以非常高的“数据粘性”,汇聚了大量的流量。这背后的原因是互联网上无稀缺:价值是守恒的,但是数据不守恒 。价值是稀缺的,数据也本该是稀缺的,而一旦数据被放到互联网上,稀缺就不成立了。这种非守恒性使得数据易复制、易泄露、易扩散。那么如何破局呢?

在这里插入图片描述

我们首先需要了解现在的几种数据经营模式:

私有终端模式 :由单一厂商全程掌控,这种模式在金融行业的资讯供应商中比较常见,有助于防止数据扩散,但在保护自己的同时,也限制了进一步的发展,存在以下几个问题:从数据来源来说,低成本采集是有极限的;从裸数据、带标数据,到智能化高阶数据、场景数据的链条过长,发展到一定程度会因为进入了不熟悉的技术领域而脱节;另类数据崛起,物联网数据、非结构化数据、平台数据等都在汇入传统数据,存在来源多样化、依赖数据协同、断供风险大、范围开放难固定等问题;权利意识正在逐渐觉醒,这对私有终端模式的发展也带来一定的影响。

数据湖模式 :由第三方掌控,多见于将政府数据用政府授权的方式集中起来,也即政府委托一个数据强势的平台方来运营数据湖,这种方式不一定合适金融业。

数据联邦模式 :包括去中心化的保护隐私的计算方式,也包括机器学习界提出的联邦学习方式,同时也兼顾数据权益保护等,目前的发展初具雏形。数据联邦的演进路径主要为:裸数据交易(全部可见)→使用权交易(可用则可见)→背靠背交易(可用不可见)。

互联网平台模式 :流量来源单一,有确定的流量入口,可以沉淀出数据,所沉淀的数据不外泄,但可以跟数据的需求方对接,例如电商所沉淀的数据可以提供给金融业使用。为什么互联网平台能够有如此神奇的数据汇聚能力,也即所谓的“数据粘性”呢?在眼球经济下,眼球之争实质是入口之争,而基于认知心理学领域的“常委定律”,人类的短时记忆容量是有限的,在数屏的APP中真正能够被用户经常使用的APP也是有限的,倒推下来,有机会留在大众眼球中的APP也是有限的。

面对数据需求与技术发展,市场一方面越来越需要“全栈服务 ”,包括场景集成、内容深加工等,另一方面需要开放的生态 ,企业可以将数据与共性技术服务作为后台,将基础业务能力作为中台,同时也将业务能力延伸到外部,把外部的服务集成进来与自有的服务一起推向前台。

隐蔽实体,见证关系

实现“全栈服务”与“开放生态”的转变,技术上的核心诉求是把实体隐蔽起来,去见证关系 。实现手段包括传统密码学和非密码学两种方式:传统密码学的方式涉及多方安全计算以及常规的安全协议;非密码学的方式主要是联邦学习。将这些技术按照严密的业务逻辑组织到一起,离不开区块链,尤其是智能合约。通过区块链的组织,这些技术可以构成数据权益保护的技术体系,让各参与方能够在去中心化的环境中进行可靠的见证,做到数据可用不可见

基于传统密码学的数据权益保护技术,不一定是彻底的,可能是有所牺牲的,例如牺牲去中心化、牺牲效率、牺牲隐私性等,会有一些侧重。例如央行的CCP方案没有采用区块链技术,但是基于区块链的思想做了中心化的系统;以太坊的状态通道(State Channel)方案,通过智能合约实现通道用户加密通信以及最终价值分配方案解密;R3联盟的Teer-off方案能够做到将隐私信息和公开信息用哈希树的方式串联起来,部分可见、部分不可见,但是不影响区块链本身的哈希值。

资本市场的交易后处理可以采用传统密码学的方式,既实现同时记账,又让每个证券公司只能看见涉及自身用户的单边账;买卖方研究机构对接时,可以使用同样的技术让特定的买方和特定的卖方建立别人不可见的连接,同时双方的数据也可以直通,一方的电子化文件直接通到另一方的系统里,并且还可以支持购买前的可信预披露机制。

基于非密码学的数据权益保护技术主要是联邦学习,基本思想是**“数据不动模型动”** ,依次运行不同数据所有者的数据,积累参数,走的时候只带走参数而不带走数据,从而在不汇聚数据的情况下,达到数据汇聚的效果 。但是模型从进到出,参数的变化能否反推出私有数据?是否足够安全可靠?如果数据是由多方贡献的,如何评估数据贡献度?依据这样的贡献度,如何去进行权益的分配、建立收益分享机制?所贡献的数据可能有优质数据、劣质数据,如何区别对待?这些是联邦学习带来的一些新问题。

提供基本的匿名性服务→有限局部的保护功能→全面彻底的保护功能→保护与利益分享相结合,这是区块链+数据权益保护技术的发展路径,需要通过博弈达到均衡

得生态优势者得天下

生态封闭性,使得生态外的应用和生态内的应用对于数据的访问权有明显的差异,造就了壁垒。壁垒的目的是要维持竞争的优势,但狭义理解的壁垒,一定要把别人的数据都抓在手里的壁垒,可能并不是优势 。通过打造去中心化的平台,可以让外部数据、外部应用都具有独立管辖权,不直接使用外部数据,而是通过外部应用间接使用外部数据。

试想,如果各种要素都能够在一个生态中得到有机的结合,内部的数据、外部的数据都能够纳入进来,深加工的结果、传统的结果也都能纳入进来,不同主体的贡献都能衡量出来并结算,特别是证券市场相关的数据如果能跟交易结合,那么就既可以to B也可以to C,希望行业能够共同朝着这样的愿景来努力。

更多金融科技文章见恒生LIGHT云社区

标签:外部,数据,稀缺性,技术,中心化,保证数据,区块,密码学
来源: https://blog.csdn.net/weixin_44433834/article/details/116194030