杜鸣皓:数智文明时代,“数据要素”是越多越好吗?_风闻
杜鸣皓频道-《数智经济》《轻资产时代》《金牌公关人》作者12小时前
人类进入数智文明,千万不要把“数据产业”变成第二个“房地产”。
答案:数据不是越多越好。
人们常说,数据治理就像是“治水”。
宏观的自然系统里,水太少会干旱,水太多会泛滥,人类的数智文明系统也一样,被束之高阁的“死数据”可以多,要经常维护的“活数据”要少,整体的数据量要追求适度合理,与社会发展相适应,数据量太少不足以支撑数智文明,数据量泛滥则势必引发局部的数据灾难,要动态维持数据量与整体社会算力、能源可承载的水平。
数据产业,应该像人体“肾脏”系统的治水看齐,人体的水液太多,就会得“蓄水病”,人就会反应迟钝,变笨、变傻,数据作为数智文明时代的生产要素,它也需要像人体水循环一样,时刻保持“代谢循环”,保持合理数据量,不可以无限制地持续增长。
人类数智社会的数据量越多,数据治理的难度就越大,对应的算力、电力等资源承载也会水涨船高,人类并不会因为数据量的绝对“多”而产生更聪明的AI,数据一味求多的不合理“治理”,反而会适得其反,让智能系统让人得了蓄水证一样变“迟钝、笨拙”。
举一个例子,“比特币”就是一个糟糕的数据治理案例,决定了它不会有未来。
它的区块数据,会随着交易的增加而无限增长,缺乏基本的数据代谢能力,跟肾水治水不一样,人体会把一些水液排泄掉,但比特币就像是貔貅一样,它不排泄,最终会导致比特币交易迟滞和去中心化失败,它以牺牲整体系统的智能、敏捷为代价,确保个体交易的隐私安全和去中介化,这不是人类数智文明时代应有的数据治理范式,同时这也是人类未来发展区块链技术和Web3.0网络,需要特别注意的问题。
所以,相比于绝对数量的“多”,数据产业更注重合理数据量基础上的“精”,同时,尽量不用合成数据,要用“元数据”,有人给元数据了一个定义,就是2022年大模型之前互联网上的数据,因为后面的数据被AI污染了,被污染这一点是事实,但这样定义非常不合理,言外之意好像2022年之后的数据就没有“元价值”了,这是典型的数据歧视,其实,只要是一手数据都可以定义为“元数据”。
从宏观的文明发展来看,整个人类历史当中,曾产生浩如烟海的“数据”,但只有少部分价值数据被保留了下来,大量的其他数据成为了历史的尘埃,为什么人类不把所有的数据都保留下来呢?
因为人类文明负担不起,数据量越多,所需要构建的人类文明系统就越重,它不利于人类文明的新陈代谢和持续进步,数智文明作为人类社会的第五文明,对数据“代谢”的治理态度,并不会有本质的区别。
人类进入数智文明,千万不要把“数据产业”变成第二个“房地产”,推动从“地租时代”向所谓的“数租时代”转型,幻想着只要创造数据就能收租赚钱,因为以量制胜的畸形数据观,将会纵容各国政府的政绩冲动,为保数据量而减少对非价值数据的正常代谢出清,甚至凭空造出很多低价值数据,导致出现严重的“数据泡沫”和数据调用困难,从而让整体数智文明出现效率降低、智力蜕化,人类文明将因此遭遇数据反噬。