中文大模型"极其愚蠢论":是无知偏见还是别有用心?_风闻
ccst-观察、观察、再观察 —— 我是世界观察员28分钟前

.
7 月 30 日的观察者网上登了一篇奇文,标题就直白地说 “中文大模型极其愚蠢”,引起笔者和不少网友的关注。作者自称是前波士顿咨询董事总经理、前 IBM 咨询全球合伙人,还搞了个 “企业知识开源计划”。不过这些头衔到底有多少分量,因为这人没什么名气,笔者也犯不着去细究。但他在文章里,就凭着一个漏洞百出的网络谣言,给整个中文 AI 领域扣上 “极其愚蠢”“没什么推理能力” 的帽子,甚至说现在的技术路线肯定走不通。这就让人忍不住想问:他说这些,到底是因为不懂技术产生的偏见,还是背后另有什么想法?这事值得好好说道说道,把道理掰扯清楚。
.
这篇文章最站不住脚的地方,就是把中文互联网上个别虚假信息的传播,当成了大家认知能力不行的证据。作者拿《特朗普爱上在白宫当保洁的我》这个谣言举例,说中文互联网上 “到处都是垃圾信息”“读者无脑翻”,并由此推导出中文大模型愚蠢、推理能力差的结论。这种说法根本经不起推敲:事实上,不管是哪种语言的互联网,都少不了谣言。英文网上,说 “5G 能传播新冠”“地球是平的” 这种荒唐言论,传播得也很广,难道就能说用英文的人都没脑子?作者把个别情况说成是普遍现象,说白了就是想当然,缺乏严谨论证态度。这种做法严重损害了文章的可信度,也反映出作者在认知和思维上的局限性。
.
更值得追问的是,这位作者到底懂多少 AI 技术?他写下这篇充斥着情绪化指责的文字,真实目的到底是什么?从他对大模型技术原理的认知来看,证明他根本不具备评判 AI 发展的资格。目前世界上任何大模型,无论是中文还是英文模型,核心原理都差不多,都是通过学习海量的文字材料,找到里面的规律,再根据概率来生成内容。说白了,它们就是把已有的信息重新组合一下,没有办法做到像人类一样主动进行逻辑推理、判断信息真假。这个基础常识,被作者刻意忽略了。互联网上本来就什么信息都有,有故意编的谣言,有断章取义的观点,还有包装成 “权威解读” 的错误说法。大模型只能根据文字出现的 “频率” 或者 “关联性” 来回应,很难主动看出信息是不是真的。这不是技术 “偷懒”,而是现在 AI 架构都存在的问题。最让人反感的是,作者明明知道这是所有大模型都有的毛病,却非要只盯着 “中文大模型” 说事儿,故意把这种全球都存在的技术难题,说成是中文环境下技术发展的问题。这种不顾事实、专门挑着说的做法,用心不良,明眼人一看就知道。
.
另外,作者对 AI 技术发展方向的判断也太短视了。他说 “大多数大语言模型公司最后都会破产”,却看不到这项技术正在深刻改变各行各业。智能客服让政务服务效率提升数倍,群众办事不用再跑断腿;AI 辅助诊断为基层医院赋能,偏远地区的患者也能享受到更精准的诊疗建议;内容生成工具解放了创作者的生产力,让创意得以更高效地落地。现在的技术路线可能不是最终形态,但它已经在方方面面改变着世界的运行方式。回顾历史,从蒸汽机到电力再到互联网,每一次重大技术变革起步时都不完美,都是在持续改进中逐渐成熟。作者却把还在探索的技术路线一棍子打死,还说 AI 只是在业务流程中 “插科打诨提供情绪价值”,这实在太小看 AI 了。AI 在数据分析、流程优化等领域的作用至关重要,它能在一瞬间完成人类难以企及的复杂计算,早已成为企业数字化转型的核心助力,为各行各业的效率提升和模式创新提供着强大动能。
.
作为一个过来人,我要教育教育这位作者,在 AI 发展越来越快的当下,理性看待技术上的差距,比故意制造对立要重要得多。中文大模型确实需要在逻辑推理、减少错误信息等方面继续努力,中文互联网也需要营造更健康的环境,但这些都应该成为前进的动力,而不是自我贬低的理由。真正的理性思考,不是盲目地吹嘘技术多厉害,也不是无脑的全盘否定,而是根据事实,看到差距并找到解决办法。毕竟,判断一项技术或者一种文化有没有价值,不是看它是不是完美无缺,而是看它有没有自我革新的勇气和不断进步的活力。中文 AI 的未来,不在那些悲观的预言里,而在每个理性对待、踏实做事的人手中。