祛魅科学(四):数据仅能用数值记录状态,却无法记录运动而生命在于运动_风闻
道学民科-02-12 22:48
最近不是ChatGPT刷屏了,不论大数据还是AI最基础的就是数据了,正好我最近看《三体》电视剧琢磨三体问题有些小收获,算是有了金刚钻,可以揽数据这个瓷器活了。惯例先声明:如果把大数据和AI看成一种工具的话,我永不反对,还会非常欢迎,好用的工具谁不爱。
先说数据怎么产生的?以我这水平一贯的按照刻板印象来,我敲一下键盘马上就产生了数据,用科班的话来说数据因运动而产生。有人会问,要是不动也能产生数据呢?请你参考绝对零度。既然数据是因运动而来的,那么我用一个简单的例子,描述一下整个过程,大家自然就能看出问题所在。
从山脚到水边有百米远,狗以每秒一米的速度,花费百秒可以从山脚走到水边。这是一个经典的完美的运动描述。能被记录下来的是什么?山脚到水边的距离,狗的速度,花费的时间。至于狗是如何从山脚到水边的,有记录吗?有人会说二哈是走着过去,京巴说不定是小跑着,茶杯犬必须要冲刺才行。别废话了现在就假定是细犬走着过去,那么细犬第一步是迈左前腿还是右前腿?迈腿的时候尾巴摇不摇、舌头吐不吐,鼻子嗅不嗅?我这一切都是为了记录下运动。到这里大家要质疑我九年教育白学了,其实没有,我是知道公式:距离=速度×时间(100=1×100)。对比一下前面的自然语言描述,大家发现了吧,数据只能用数值来记录状态,却无法记录运动。而运动需要公式、定理、定律来表达。一旦用公式,定理,定律来表达运动,参考祛魅科学(二),失真的问题就不能忽视了。
有人可能不好理解,为啥数据无法记录过程。我再举一个例子,大家都看过电影吧。那种老式电影是用胶片的,胶片是一幅静态的图像,通过每秒三十帧的运动,这才能让人眼看作连续的运动成为电影。放电影的运动能记录下来吗?再拿一台摄影机录一下不就行了,完成记录的是摄影机里的胶片,胶片是一幅静态的图像,请问记录的运动呢?这个描述是有些烧脑,但能确定的是运动是无法记录的。
既然数据无法记录运动,运动的表达依赖公式、定理、定律,失真就不可避免。万幸的是人类出了位冯•诺伊曼,发明了计算机,数据的计算处理就有了新的办法。人就可以把更多的精力投入到失真的问题上了,今天的大数据和AI其实就是缩小失真后才体现了价值。咱曾经也当过一段时间的码农,所以高级编程语言也会一点,也知道编程三板斧:赋值、if判断、for循环;往上走就是递归、遍历、迭代;计算机最拿手的是穷举法,数值解穷举来近似的完成解析解。大数据指的是数据量大管饱;AI指的是算法精妙,两者结合完成对失真的调制,主要应用迭代和穷举达成最优解。这也仅仅是治标不治本,现在看起用大量数据加精妙算法完成了失真的收敛,以后随着数据量的继续迅猛增加,失真还能控制的住吗?
数据只能用数值来记录状态,而数值是关于量的抽象,公式、定理、定律又是一种基于抽象后的量而建立的,如同老话说的螺丝壳里做道场。不论大数据还是AI都针对的是可量化才能应用,对于无法量化的是无能为力了。而众所周知运动是无法量化的,生命恰恰又在于运动,一个生命无法运行意味着死亡。现在说的数字生命这四个就是一个悖论组合,数字是可量化的,生命是不可量化的。以后真有数字生命也应该叫作数理生命,数理是可以包含“不可量化”这层含义的。
最后说说别看ChatGPT刷屏,好像很厉害,那怕以后的人工智能更厉害,请大家不要忘记所有的这些都是基于精妙的算法才成立的,而精妙的算法是人设计的。当你面对像ChatGPT这样看起来匪夷所思的机器时,最容易忽略的就是这台机器也是人设计制造出来的。就如同大家现在习惯了各种公式、定理、定律之后,而忘记其失真的事实。更重要的是人不会设计制造一件无意义的工具的,而任何一件工具都不可能只有好处,或者是只有坏处。
我非常希望有人能证明运动是可以量化的,那么意味着以后可以走直线了。
又算是蹭了热点的尾巴了,从ChatGPT刷屏到现在时间不够,我自己瞎想的也没有琢磨透彻,写出来的东西只能求上天保佑能自圆其说,凑合的看吧。这次ChatGPT刷屏的热点,还有一个感慨,就是现在最不科学的就是,科学教只讲科学不讲人,没有人才是科学教的科学。参考《小破球二》马兆名言:“没有人的文明,毫无意义!”。