Select Language

AI社区

数据要素产业

数据要素的四个基本特性

01-18 16:13 TAG: 数据要素 数字经济

(一)非竞争性

数据容易存储,而且可复制性强。如果不考虑运行维护和存储成本,几乎可以无限制复制。无论是统计机构发布的调查数据,还是各种互联网平台收集的个人数据,都可以同时被多个用户使用,物理意义上说不会产生任何损失,同时也不会相互影响,非竞争性特征明显。一个典型的例子就是Kaggle设立的机器学习竞赛,相关数据就可以被不同参赛者使用。因此,数据和石油等自然资源不能简单类比,因为后者竞争性,多开采一桶石油,地球上石油储存量就少了一桶(Varian,2019)。反倒是将其比作阳光,似乎更为恰当。当然,实际使用过程当中,数据的获取需要必要的付出及条件,不像获取阳光那样无成本,所以数据仍然存在一定排他性特征(Partially Excludable; Carriere-Swallow和Haksar,2019)。正因为如此,根据非竞争性和一定的排他性,数据可以视为一种准公共产品或者公共品。

(二)互补性

不同来源的数据相互融合,可以提高揭示潜藏线索或者规律能力,增加单一数据源的边际价值,一定程度上可以使数字要素具备规模报酬不变甚至递增的特征。规模报酬不变、网络外部性是经济实现内生增长的重要源泉。Krugman、Romer是为数不多的认识到收益递增的主流经济学家,而圣塔菲研究所的Arthur对此有很系统的研究(复杂经济学,2018)。

也有观点认为,数据作为一种投入要素,边际回报仍然呈现递减特征,这和其他要素没有什么本质的不同。Varian(2019)举例说明,图像识别的精确度会随着训练时投喂的数据量提高而增加,但改进的速度会逐步放缓。但这样的观点只是强调了数据要素的单一应用。尤其值得重视的是,由于数字技术的发展,使得原来很难数字化的行为或事物都可以数字化,真正实现了古老哲学中的“万物皆数”,这就为跨界数字融合创造了前所未有的条件,使原来不相干的领域实现了联结。这也是数字时代创新和价值创造不同于工业时代的重要特征。数据具有非竞争性,能够被用于多个用途,而且后续使用边际成本会不断下降,加上互补性和网络性以及学习效应,数据要素仍可能具有规模报酬递增的特点。

(三)外部性

数据分享的确有助于促进研发、改进产品和服务质量,提高效率,但同时,由于存在信息不对称和平台的市场垄断地位,分享数据的一方未必能够获得足够补偿, 由此产生了隐私外部性(Carriere-Swallow,Haksar,2019)。比如,消费者数据可能在不知情的情况下转移给第三方,导致更多垃圾信息骚扰或不利的价格歧视(Odlyzko,2003)。这些负外部性很难被消费者和数据采集企业内部化。

由于不同数据之间具有关联性,可以用线性规划等方法,从一类已知的数据推断未知数据,从一组用户的行为数据可以推断另一组用户的行为。这样,就可能造成数据公开分享过程当中,用户隐私泄露,引发数据伦理问题。而且还会导致数据过度供给,数据价格过低,从而降低数据市场效率(Acemoglu等,2019)。这也决定了数据要素的安全共享使用,与加密技术的发展密切相关。

另外,数字化企业可能依靠网络外部性,过度集中数据,并获取大量超额收益。掌握或拥有独有的数据,就像掌握了独有的专利和技术一样,可以使数据的掌控者获取一种超额收益。这样,就会强化数据的私有属性,阻碍数据的分享和融合。某种程度上,申请专利和获取独有数据,都是市场主体建立竞争力或护城河的重要方式。

(四)指数级增殖性

数据可以看成是各种有意识或者无意识活动的附属品。数据的应用过程,本身可以产生更多新的数据,加快决策或者算法的迭代。例如,无人驾驶汽车,由基于数据训练得到的算法控制,行驶里程越长,将产生更多场景数据,反过来可以促进算法的进一步优化,形成“数据—算法—数据”的自我积累增长过程。随着整个经济社会数字化的程度提高,智能手机的普及,传感器的广泛应用,宽带传输技术的升级,算力的不断增强,全球互联,万物互联,数据要素呈现指数增长态势。根据IDC估计,到2025年,全球数据预计将达到175ZB,与2019相比,年均增长27%,相当于数据规模三年翻一番。数据规模是经济规模的增函数,超大规模经济体可能因此积累更多数据优势。

数据的指数级增长,会对经济增长产生何种影响,存在一定争议。一种观点认为,数据增加有增长效应(Growth Effect),即数据的规模报酬递增或不变特性,可以实现持续经济增长。由于存在数据反馈环(Data Feedback Loop),企业收集数据,就能够获得更大的市场地位,并因此获得更多数据(Farboodi等,2019)。巨大的门槛效应以及网络外部性,有助于实现规模经济。此外,围绕数字化产生更多类型的产品和服务,扩大了现有的产品服务空间,从而推动经济的可持续增长。但也有反对的观点,认为数据增加仅有水平效应(Level Effect),或者说受制于边际报酬递减,更多的数据并不会使得经济增速的路径发生改变。即使存在规模报酬递增,这种效应也只存在企业内部,无法适用于整个经济。Bajari等人(2018)应用亚马逊的数据进行了实证,表明来自数据规模增加的收益存在上限。


作者:OpenMPC开放隐私计算 https://www.bilibili.com/read/cv18783501 出处:bilibili