您当前的位置:首页 > 公告新闻 > 中物财经

关注大数据的使用边界,助力科技赋能实体经济

2022-06-29 来源:

 

 

导读

6月22日下午,中央全面深化改革委员会第二十六次会议举行,审议通过了《关于构建数据基础制度更好发挥数据要素作用的意见》。习近平主席在主持会议时强调,数据基础制度建设事关国家发展和安全大局,要维护国家数据安全,保护个人信息和商业秘密,促进数据高效流通使用、赋能实体经济,统筹推进数据产权、流通交易、收益分配、安全治理,加快构建数据基础制度体系。

会议指出,数据作为新型生产要素,是数字化、网络化、智能化的基础,已快速融入生产、分配、流通、消费和社会服务管理等各个环节,深刻改变着生产方式、生活方式和社会治理方式。要建立数据产权制度,健全数据要素权益保护制度,建立合规高效的数据要素流通和交易制度,完善数据全流程合规和监管规则体系,建设规范的数据交易市场,完善数据要素市场化配置机制。另外,会议强调,要构建政府、企业、社会多方协同治理模式,强化分行业监管和跨行业协同监管,压实企业数据安全责任。要强化金融控股公司监管和平台企业参控股金融机构监管,强化互联网存贷款、保险、证券、基金等业务监管,加强平台企业沉淀数据监管,规制大数据杀熟和算法歧视。

近期,中国人民大学国际货币研究所(IMI)举办的大金融思想沙龙(总第187期),就“大数据的使用边界”展开讨论。IMI特约研究员、中国人民大学财政金融学院副教授邱志刚在主题发言中分享了最新学术研究成果,他通过建模研究分析了数据使用边界对资本市场和实体经济的影响及具体影响渠道。结论指出,大数据的使用应有其边界,资本市场参与者通过对大数据的使用影响了资产价格的有效性,从而影响了金融对实体经济的贡献。由于对隐私保护的担忧,这种影响又反过来决定了数据的使用边界。

更多干货内容,详见发言全文:

 


大数据的使用边界:对金融市场和实体经济的经济学分析

 

01

大数据时代的特征

 

当前,我们进入了一个所谓的大数据时代。比如,2017年时用百度搜索“双十一”就可以看到线上的交易量是多少,以及在各个城市分布,交易量非常惊人。这里我引用了马云的一句话,“很多人还没有搞清楚什么是PC互联网,移动互联网来了。我们还没有搞清楚移动互联网的时候,大数据时代又来了。”

不管我们承认与否,我们都生活在大数据的时代。从学科角度发展,我们看到了新兴学科,金融科技的发展。我个人认为金融科技本质上就是数据驱动的。一方面,像蚂蚁、腾讯、脸书(现在叫Mata)这样一些互联网巨头的发展,以及对金融行业的渗透,本质上都是数据驱动的。

从金融科技专业或者教学的角度来讲,本质上我们在做一些什么事情呢?一方面是介绍早期互联网金融和金融科技发展,也就是金融创新;另一方面,我们介绍大数据的使用,这部分是学科发展的核心。很多项目会开设机器学习、文本分析等课程,这些课程本质是掌握对大数据进行分析的技术。还有一些是针对大数据使用而发展起来的技术,比如区块链,本质上其实共享账本(或数据库)以及加密技术的应用。我个人认为在大数据使用过程中并不是一帆风顺的,我们有很多困难,而区块链是解决困难的方法之一。这点后面也会介绍。

有一本畅销书叫做《大数据时代》,书中用“4V”——Volume  Value  Variety  Velocity来介绍大数据的特征。那么从直观角度来讲,什么是大数据?首先,它的量越来越大了。通过“双十一”的例子可以看到,它同传统采集的数据不是一个量级的。第二,数据更杂。早期我们看资本市场看的是股票价格、交易量这些维度不是特别高的数据。但今天哪怕一些看不见的维度,我们也试图对它进行分析,例如主成分分析法(PCA)的广泛应用。第三,结构非常复杂。早期我们有结构化数据,当时说的结构化数据是指可以用数字来表示的,在Excel里面可以直接用统计软件对它进行分析的数据。后来慢慢变成非结构化数据,比如现在流行的文本分析,还有图片。早期在分析投资者情绪和注意力是时,也会用一些报纸上的信息,当时是招学生助手帮忙人力收集的。而今天可以利用网上的图片来构建投资者情绪的指标,甚至还可以利用视频。这些都是和传统所用、所看到的数据所不同的。随着技术的发展,我们可以从这样的数据里得到有用的信息。第四,数据在使用中是有价值的。从很直观的角度,我们以前不看这些数据,但是今天我们看了。因为通过这些数据能够获得一些额外的信息,而这些信息可以产生价值,这是我们对大数据使用的初衷。但是不是全是价值呢?在“4V”之外,数据的使用是否还有一些成本?例如个人隐私。

 

02

大数据的价值与成本

 

大家最近从金融科技行业的发展能够看出,早期是一种包容性监管,比如对支付宝扫码支付当时从政策上是相对包容的。但是今天,监管严格了起来。为什么严格起来,因为数据的使用是有成本的!我和我的两位学生试图在学术文章中对这样一些问题进行探讨。

这里我们先举两个例子说明数据使用的价值和成本。第一是大数据的价值,这个例子用的是芝麻信用。芝麻信用是给个人的征信分,这个征信分的原型在美国叫做FICO,因此芝麻信用和FICO在结构上非常相似,打分也非常相似。芝麻信用这种创新的出现和我国传统金融体系有关。从我国传统银行金融体系来看,个人征信并不多,早期个体享受到的金融服务相对有限,个人征信体系的缺乏是其中很大的一个原因。因为数据的缺乏,个人的信用到底是多少很难了解,很多时候只有你买过房子,贷过款才有征信记录。美国的FICO是给个人征信进行的打分,那我们看一下FICO都包含什么因素?FICO包括信用历史,新信用卡、使用过信用卡的类型、欠款金额和支付历史。这些信息都是信用强相关的,也就是说这些东西都是使用过信用卡或者产生过信用的行为留下的痕迹。换句话说,如果之前完全没有使用过信用卡,完全没有产生过借贷关系,这时候FICO分是非常低的。因此,从美国传统个人征信体系FICO来看,大数据对它的影响不大。

再看芝麻信用。芝麻信用的影响隐私中有信用历史和履约能力(这两点和FICO很像),这是信用强相关的。但身份特质、人脉关系、行为偏好这些在芝麻信用里也占了很大的百分比,这些东西不是信用强相关的。也就是说哪怕你没有使用过信用卡,只有一些上网行为,这里也会产生一些新的信息,这些信息转化成芝麻信用,作为你个人的征信,而你可以利用这个征信享受到一些金融服务。在我和几位同事之前发表的一篇文章中,我们把大数据产生的信息形容成一种抵押品,也就是说数据可以作为个人的抵押品。消费者利用“数据”这一新的抵押品可以享受到在传统金融体系下之前享受不到的金融服务,这是一个大数据产生价值的例子。

下面看成本。主要举两个例子,其他的我们在文献综述部分详细讨论。一是隐私保护,大数据时代其实要比以往更在意隐私保护。比如Facebook拥有27亿用户的信息,听到这个数据大家会不会对这家公司产生一些焦虑?因为其实Facebook可以利用数据知道很多个人的隐私。另外,斯诺登在《华盛顿邮报》和《英国卫报》上进行了披露,说美国政府早在2007年就开始了一个“棱镜计划”,包括雅虎、微软、苹果等九大科技巨头都有参与。在这个计划中,美国政府对美国公民或者非美国公民同美国公民有一些聊天记录、E-mail往来时,都会进行监听。这个事情报出来之后,引起轩然大波。在今天,尤其是大数据时代,我们对隐私保护是非常敏感的。

另外一个很常见的例子是大数据杀熟。这条新闻说的是某一女子网购同一个商品,用不同帐号但却发现有差价25元。为什么叫做大数据杀熟呢,你在网上进行买卖时,你的数据是披露给平台的,平台通过数据能够“熟悉”你的偏好。这个现象在经济学里并不新,其实就是一个“价格歧视”,但在大数据时代,“熟悉”个人偏好变得更容易了。比如网约车,你打车去机场或是赶飞机,价格是不一样的。对不同的人、相同的时间,相同的地点、相同的距离打车的价格也可能是不一样的。我之前和我的一位学生在网上看机票,我搜了一下,到洛杉矶给我的机票是1.6万,给我的学生是4000元,这都是常见大数据杀熟。

总结一下,大数据在使用阶段,不管你承认与否,你已经在充满数据的时代,由于智能终端的存在,你的一些行为都会留下数据痕迹。而留下的这些痕迹就是大数据,一方面大数据可以让消费者享受到更便利的生活,产生了之前我们享受不到的一些服务。另一方面,数据使用会产生成本,这个成本可能是隐私,可能是大数据杀熟。我们之后再给大家介绍一些学术界对它的关注和其他的一些成本。

 

03

研究动机介绍与大数据边界举例

 

首先,我们认为大数据时代,数据使用是有边界的,我们不能无穷无尽对数据进行挖掘。从监管角度,例如《个人信息保护法》的出台,可以看到对数据的使用是有一定的边界。一方面大数据出现可以提供新的生产力,很多时候甚至作为一种新的生产资料投入到生产之中,产生了价值,对于消费者来说可以享受到更好、更多的服务,尤其是一些个性化的服务。从金融角度可以增强普惠金融,早期很多时候个人是很难有很好的金融服务,但今天随着数据发展可以享受到很多新兴的金融服务。从公司的角度,可以为公司提供更多的信息,也可以为资本市场提供更多的信息。今天在资本市场,我发现我不少之前教过的学生都在用机器学习的方法在资本市场上进行交易,用非结构化的数据提取信息进行投资策略的构建。

另一方面,大数据使用会产生成本。我们这篇文章想研究数据使用边界对金融市场的影响,因为金融市场有人在使用大数据,就会对市场价格产生影响。同时实体经济的发展中也适用大数据,大数据对对实体经济也有影响。我们这篇文章是通过大数据对资本市场和实体经济的影响,反过来看这些经济金融行为如何影响到对大数据使用边界的确定。因为我个人的偏好,我研究的方法是用数学建模方法进行分析,这里我主要讲一下通过分析得出什么样的结果。在建模时,我们分析包括了资本市场和实体经济,以及利用数据使用的成本构建数据使用的边界。

这里很重要的一点是数据使用的边界。关于数据使用的边界,首先在文章中我们举了几个例子。

  • 爬虫软件使用的合法性及范围

爬虫软件在大数据使用中非常重要,它从2013年出现,在2016年开始呈现爆发性增长。但有一个问题,爬虫软件到底什么该爬,什么不该爬。这需要在立法上有更清楚明白的规定。比如《个人信息保护法》在2021年实施时规定如果在网上提取超过大概50条以上的信息且没有经过个人同意就保留就是侵犯个人隐私。杭州摩蝎数据科技有限公司是第一个根据法律被判的大数据案件,摩蝎数科当时保存了大概2000多万条,当时做爬虫软件时也和个人签订了一些协议,但最后还是判了侵犯个人信息。

爬虫软件本身是一个技术,技术本身不分好坏,技术是中性的,主要看你怎样利用它。如何利用它,这个度是什么,这也是为什么我们想用大数据使用边界作为研究的点,这也是其中的一个案例。

  • 区块链技术的应用

区块链的本质是一个共享的数据库,尤其我们说联盟链的时候,实际上是几家机构一起共享数据。举个简单的例子,商业银行和科技巨头蚂蚁共享投资者的数据,这时候肯定可以从数据里提取出一些更好的投资者信息,这些信息可以让消费者享受到更好的服务。但这个数据涉及到个人隐私,那我们就不能直接把它放进数据库共享,很多时候我们会用一种加密技术把数据加密,我们共享的是加密的数据。但哪怕是共享加密数据,这算不算是对隐私的侵犯?我们用这个例子,说明一方面要共享数据,利用更多的数据创造价值。区块链使用本质上也是基于数据的,在大数据阶段我们既想共享数据利用价值,对数据进行分析,但同时又要保护隐私。可能这种联盟链(共享数据库)加上加密计算,就是区块链在数据上非常重要的一个应用。

虽然今天进入到大数据时代,但我们是不是真的准备好了,是不是在数据使用过程中完全没有问题了,现实未必是这样。

  • 数据隐私悖论

这是罗汉堂的陈龙老师和普林斯顿大学熊伟老师以及其合作者写的一篇文章。这篇文章中利用了蚂蚁支付宝的调查问卷的数据。他们做调查问卷时,有一些人非常在意数据上的隐私权和隐私保护,但是这些人在选择是否披露数据来享受服务时还是选择了披露,也就是说他们选择享受APP所带来的便利。所以,一方面大家都在说很在意隐私保护,但用APP的时又同意共享信息,这就叫做隐私悖论。当然隐私悖论有一些它的原因,有经济学家进行了分析,讲到这里就会引出对大数据的使用边界、价值、成本的内容。

 

04

文献综述

 

以下从几个方面对我们文章所引用的文献进行回顾。

  • 好处方面

首先是金融数据的普惠性。金融科技的发展需要技术的发展,而技术投入的成本是固定的,当技术成本投完之后是会带来一定的规模效益,所以它的普惠性能够给我们带来很多的好处。另外,芝加哥大学的何治国教授和他的合作者写过一篇文章是关于“开放银行”的,这是现在很热的一个题目。开放银行是指大数据时代,银行和数据公司(科技巨头)联合起来共享数据,而消费者可以选择是否披露/共享数据。他们的文章表明在开放银行的情况下,如果大家再有隐私保护,消费者的福利可能会被削弱。另外,大数据的使用还可以让消费者享受到个性化的定制服务,像淘宝这样的平台,在互联网上实现买卖双方匹配很困难。这个时候你的行为留下一些数据,产生个性化的推送,由此享受到一些个性化服务,这也是大数据带给我们的一些好处。

大数据所带来的好处也可以是公司层面的。首先,数据可以作为一种生产资料,提高生产力。第二,数据可以降低高质量生产的成本。比如,产品在网上卖得好,是因为产品的质量好。而交易量更多,会产生更多的数据,让更多人关注,从而降低高质量产品的成本,产生反馈效应。第三,数据作为信息会降低投资的不确定性,通过个性化服务和匹配效率扩大业务机会。比如蚂蚁小贷给商家放的贷款,这个贷款也是根据商家在网上的行为通过大数据获得的一些信息。这些信息作为金融抵押品可以让商家享受到一些金融服务。

  • 大数据的成本

大数据来决定应该不应该放款,虽然能够减少歧视,但是歧视仍然存在,也就意味着用机器学习的方法对穷人阶层还是有一定的偏见。同时,大数据还会诱导人购买一些上瘾的东西,比如一个人在网上沉溺于赌博,但是想戒除赌博,就把手上所有和赌场有关的软件全部删除了。但是,只要你和互联网接触,就会不时被推送到相关信息,这也是大数据算法推荐到的。还有比如抖音,你会发现总能刷到一些你比较感兴趣的东西,一刷几个小时过去了,这都是和算法有关的。这都是在使用大数据时的成本。

还有数据的外部性,这是MIT  Acemoglu写的一篇文章,之前我们聊到隐私悖论,哪怕在意隐私也愿意共享信息。这篇文章给出一些解释,你在共享数据的时候不仅仅披露了个人的一些行为,还披露了其他人的一些行为。举个例子,我去买一种口香糖,是因为我感冒了,用这种口香糖可以缓解症状。之后你共享了你的信息——我感冒了,那其他人如果再来买这个口香糖,哪怕他不去披露自己的信息,平台也有一定的概率知道他可能也感冒了,这就是外部性。回到前面说的隐私悖论,哪怕我不披露信息,其他人披露了信息,他们也会知道我的信息,那我不如披露算了。这是对隐私悖论的一种解释,也都是我们在数据使用方面所产生的一些成本和收益。

 

05

模型

 

从建模角度考虑动态多期模型,时间点是t=0,1,2,3。我们把大数据定义为隐私敏感数据,除了大数据之外还有其他的数据,我们称之为隐私不敏感数据。

首先最后一期是一个实体经济的产出,参考文献(Subrahmanyam&Titman,1999 and Goldstein  &  Yang,2017),我们简化实体经济的产出(G),让其只和资本(I)相关。在大数据时代,金融如何支持实体经济?在我们的模型中,除了资本之外还有大数据的影响,这里用大数据的精度(τϵ)来表示。这是大数据也就是隐私敏感数据的精度,实体经济的产出会随着精度的增加而增加。这是因为会得到一些之前看不到的信息,包括作为生产资料以及刚才文献中讨论的那些收益,这些收益整体就用这个东西τϵ来对它进行度量。这里是大数据的精度,精度越大,证明大数据提供的信息越准确。如果 τϵ 趋向无穷,精度的影响就不见了,就变成大数据增加实体经济产出的上界,最大值我们用字母Φ来进行表示。

在模型中,我们把实体经济刻画成,一是投入的资本,二是大数据的使用,这两者最终影响实体经济的收益。当然假设资本筹集有一定的成本,用下列算式刻画整个实体经济。

1.jpg

这个资本是前一期资本提供者,这里可以想像成PE或VC,做的决策。但是这些人在没有大数据的时候,他们会看一些传统数据。如果有大数据,他们会同时看大数据带来的额外信息。因为PE、VC是大数据受益者之一,他们会根据新产生的数据来决定他们给实体经济提供多少资本。同时,因为价格会提供一定的信息,PE、VC还看资本市场上资产的价格,并根据资产价格决定他们为实体经济提供多少的资本。这部分就是实体经济资本决策的部分,发生在t=2的时刻。

在t=1的时候,我们考虑的是资本市场,因为不仅是实体经济用大数据,资本市场也用大数据,很多机构会用机器学习、文本分析方法对大数据进行分析。这里资本市场我们用知情交易者和非知情交易者来刻画,知情交易者会观察到传统数据,比如财务报表,他们还会观察到大数据。大数据在资本市场中也被人使用,在资本市场被人使用后会反映到价格之中,因为市场上根据数据进行交易,一部分信息就会反映到资产价格里,资本提供者也就是PE和VC还会根据资本市场的价格来决定为实体经济提供多少资本。

在t=0的时刻,我们建模分析大数据的使用边界。我们管这个接触者叫做社会计划者(social  planner)。社会计划者通过优化过程来决定大数据的精度是多少。一方面,社会计划者要最大化实体经济产出。因为大数据能对实体经济产生促进作用,这是收益部分,要最大化。另一方面,社会计划者要考虑到大数据带来的成本。在模型中我们就用下列式子进行刻画。

2.jpg

这里用k来刻画对隐私保护的顾虑是多少,如果顾虑越高,这时候k就越大。另一方面,k还可以刻画隐私保护技术的发展,如果技术发展得越好,对隐私保护有更好的技术,这个k就越低。

这里是一个模型的图示。首先,随着时间轴0,1,2,3开始。在最后一个时刻是实体经济的实现,由大数据使用和PE、VC资金来决定,资金投入越多越有效率,大数据使用精度越高实体经济的收益就越高。PE、VC的决定是在前面这一期,这一期PE、VC决定为实体经济投多少资本,资本的决策有三方面的信息决定。一是根据大数据里提取的信息,二是从传统数据里提取信息,三是从资本市场里提取信息。资本市场里的知情交易者又对大数据进行使用,交易行为会把大数据信息反映到价格里,而这个价格还会影响PE、VC如何对实体经济投资。在0时刻,社会规划者决定的是大数据使用的精度是多少,比如刚才说到爬虫软件使用的范围和规则,比如加密技术的一些开发包括联盟链的使用,这些是他们在前面决定精度到底应该是多少。精度取决于最终的实体经济,实体经济价值又取决于前面资本市场和PE、VC投资以及大数据使用。资本市场和PE、VC的行为又由前面大数据的精度决定,所以,整个是一个动态的过程。大数据的精度决定最终由实体经济的收益成本来决定,但大数据又被金融市场交易者所使用,又被PE、VC所使用,这些使用会对最终实体经济价值造成影响。实体经济价值的影响又反过来影响决策者对大数据精度的决定,也就是对整个数据经济的发展的边界点在哪里。这是整个模型想表达的一些东西。

3.jpg

 

下面是整个模型的机制:

  • 实体经济的收益“G”,取决于PE、VC投入的资本和大数据使用。

  • PE、VC行为取决于大数据精度和资本市场风险价格,以及传统数据的使用。

  • 风险资产的价格反映出一定的信息,这里我们用了经济学里常用的REE(理性期望均衡)进行分析。价格的信息含量取决于知情投资者所拥有的信息是什么,包括对大数据的使用和对传统数据的使用。

  • 资本市场:知情交易者根据自己信息(大数据和传统信息)进行买卖,非知情交易者根据价格进行买卖,最终价格会反应出信息。

  • 最后社会计划者(social  planner)根据大数据的使用边界决定大数据的精度,包括爬虫软件、数据隐私的保护、共享数据库的度在哪里。这些取决于两个东西,一个是实体经济产出,另一个是数据成本。收益和成本两部分的取舍,也就是数据的使用边界。但实体经济又取决于资本市场和投资者对大数据的使用情况,所以,整个链条是这样连接起来的。

模型求解方面。我们整体用反向归纳法,从t=3到t=0,从实体经济均衡求解后,再来求解资本市场均衡,最后求解大数据使用边界,相当于对商的均衡进行不同的求解。大数据使用边界决定了大数据的精度,反过来大数据的精度又决定了资本市场的均衡和实体经济决策,整体上三个均衡都是动态相互联系的。解到最后,从数学的角度,精度就是边际收益=边际成本。

 

06

结论

 

首先,大数据在均衡情况下的精度随着k增加而减少,隐私保护的顾虑越高,意味着社会计划者不会让允许对大数据进行过量的挖取,也就是爬虫软件等技术的使用范围相对较窄。

第二种是k减少,这可能是加密技术的一种升级,我们能够更好的保护消费者的隐私。如果是这样的话,数据技术升级可以让大数据精度增加,意味着可以对数据使用采取更包容性的监管政策。

Φ代表了数据能够给实体经济带来的好处,比如大数据机器学习、数据挖掘技术的升级,有更好的机器学习的技术,可以提取更多的价值,这时候它的精度也会随着技术的变好而变好。这些是一些比较直观的结果,但有一些不那么直观的结果,比如传统的信息披露精度对大数据到底产生什么影响?

在模型求解里我们发现这是一个非单调的关系。从下图看,横轴是传统信息的精度,竖轴是决策者决定大数据使用的精度。要是会计报表的信息极其精确,从会计报表就可以知道这家公司的基本情况到底怎么样。这时候大数据的用处好像就没有那么大了,精度是可以下降一些的。这我们叫做信息效应,实际上就是不同信息相互替代。除此之外,如果会计报表的信息极其精确的话,还会减少PE、VC的不确定性,令PE、VC对大数据的利用更有效率,我们管它叫做实体经济效应。实体效应意味着披露越严格,越会促进大数据的使用精度,所以我们会得出一些非单调的结果。传统信息像会计报表,这些信息披露的规定对大数据使用的影响是不确定的,这个结果可能是非单调的。


7.jpg

 

除了对精度之外,我们又对一些市场指标进行研究,第一排左边第一张图是市场的有效性,第一排中间是投资的成本,第一排左三是波动性。因为传统信息精度对大数据的影响是非单调的,那它对市场上的这些指标的影响也是非单调的,当然这些东西是我们的数值解,下一步还要看实证上具体会得到什么结论。

5.jpg

最后一个结论是实体经济的效率。实际上,研究的最终目的是为了助力金融促进实体经济。由此进行一系列分析,比如在大数据时代,如果一味增加会计信息的报表准确性,是不是就一定会增加实体经济的效率,我们的结论是不一定,因为传统信息披露对大数据的影响是非单调的,它对市场指标的影响也是非单调的,那它对实体经济的影响也是非单调的。

6.jpg

 

 

6.jpg

 

07

其他大数据的问题

 

 

在大数据时代,数据给我们带来了大量的好处,但是随着这些好处的增加,也会对数据使用成本有所担忧,比如隐私保护这样一些问题。所以,数据的使用有一定的边界,这个边界最终决定于成本和收益。决策者决定时有两个考虑,一是整体经济带来的好处,另一个就是成本。因为在各行各业都对大数据有使用,PE、VC有使用,资本市场有使用,他们的使用最终会影响到实体经济价值的实现,从而反过来影响决策者对数据边界的决策。

除了这些之外,我还列了一些其他在大数据时代的问题。

  • 数据交易问题。我国建立了很多大数据交易所,从数据角度,它和其他的商品不太一样,比如我交易的是苹果,我把苹果卖给其他人,如果苹果被吃掉就没有了。但数据不同,数据交易完还在,是可以反复多次进行交易买卖。数据价格如何确定的,这需要数据市场来决定。但数据可以进行多次买卖,对不同的使用者可以卖不同的价格,甚至数据的购买者还可以再把数据卖出去,这里涉及到数据归属权的问题。

  • 数据中存在的噪声问题。大数据时代有更多的数据,但是好的数据多了,不好的数据也增加了,数据噪声比如水军大量存在。在传统数据时代没有人花钱买噪声,但在大数据使用的时代有人花钱买噪声,这对大数据有什么影响,也是我们要思考的问题。

  • 数据交易问题不可避免谈到数据归属权的问题。比如NFT技术,NFT是指非同质化的代币,每个代币都是独一无二的。我们想象有一个大的账本,可能这是一个数据资产的交易账本。数据资产作为NFT就是独一无二的,大账本把交易归属权的转变记录下来,这种交易归属权的确认对数据发展有什么影响?比如可以记录下来数据到底归属谁。这方面也有一些像Web2.0到Web3.0的转换的问题,这里不细说了。

  • 总体看,在数据使用方面不仅仅是技术问题,也是法律问题,同时更多的是经济学问题,如何理解数据的使用,这是现在一些经济学者应该做的工作。

  • 数字普惠金融,可以想像一下,每个人都会产生数据,数据如果可以作为一种抵押品让我们享受到一些金融服务,而这些金融服务又可以产生更多的数据,一来二去每个人都产生大量数据,每个人可以享受到金融的服务,最终就可能达到一个数字普惠金融理想中的状态。


友情链接