AI生成内容已超人类写作!当表达被机器接管,我们的大脑还剩什么?
新智元报道
【新智元导读】2024年11月,互联网上AI生成的文章数量正式超过了人类原创内容。韦氏词典将「slop」评选为2025年度词汇,专指AI批量产出的低质内容。当机器开始代替人类表达,人类会不会逐渐丧失独立思考的能力?更棘手的是,如果人类停止输出原创内容,训练AI的核心原材料也会随之耗尽,一场关乎语言与思维的连锁危机,正以大多数人都没察觉的速度快速蔓延。
数字营销机构Graphite在2026年5月公布了一项长期追踪研究,结论十分扎眼:从2024年11月开始,全球互联网上AI生成的英文文章数量,已经正式超过了人类亲笔撰写的内容。
ChatGPT上线仅仅12个月,AI生成文章就已经占到全网内容发布总量的39%。
到2025年,这个占比稳定维持在了50%以上,到目前为止都没有下降的趋势。
Graphite从CommonCrawl数据库中随机抽取了4.3万篇文章,用AI内容检测算法逐一排查,最终统计显示检测误报率约为4.2%,漏报率仅0.6%,数据可信度很高。
值得注意的是,这个统计只算了「完全由AI生成」的纯机器内容。
那些由AI起草大纲、人类简单润色的半机器半人工内容,根本没有被纳入统计。Graphite在报告中也坦言,这类混合内容实际上可能比纯AI内容更加普遍。
一个专指AI内容的词,成了年度词汇
这股AI内容泛滥的浪潮,有了一个精准的命名。
韦氏词典将「slop」选为2025年度词汇,专门用来指代AI批量生产的低质量内容。
有媒体把这种AI低质内容「slop」比作1919年波士顿的糖蜜大洪水:储存糖蜜的储罐爆炸后,两百多万加仑糖蜜瞬间淹没了整个街区,清理工作花了好几周才完成,直到几个月之后,地铁站的台阶上还沾着黏糊糊的糖蜜。
AI低质内容的黏性,和那场洪水的糖蜜一模一样,沾上网就甩不掉。
不管是YouTube、Reddit还是Facebook,各个平台上到处都是机器生成的填充式垃圾内容。
文学评论家Matthew Kirschenbaum发出警告,一场「文字末日(textpocalypse)」正在到来:未来人类亲手写下的文字,可能会变成挂在收藏墙里的珍品,就像早期的银版照片一样稀有。
有意思的是,机器写作的历史其实比很多人想象的要久远得多。
早在1953年,数学家Christopher Strachey就用曼彻斯特大学的计算机生成了情书,本质上和疯狂填词游戏Mad Libs的玩法没什么区别。
同年,罗尔德·达尔发表了短篇小说《伟大的自动语法机》,小说里的工程师造出了一台写故事的机器,短短一年就生产了英语世界一半的小说和故事。
达尔在小说结尾写道:「这会让你惊讶吗?我想不会。更糟糕的还在后面呢。」
七十年过去,达尔口中「更糟的」,真的来了。
语言的边界,正在慢慢塌陷
AI低质内容真正的危险,其实早就超出了内容质量本身的范畴。
它正在悄无声息地改变人类和语言的关系。
维特根斯坦在《逻辑哲学论》里写过一句被无数人引用的话:「我的语言的界限,就是我的世界的界限」。
这句话放到AI时代,有了全新的解读。
当一个人不再亲手写作,把表达这件事外包给机器,被压缩的不只是写作能力,更是他自己的思维边界。
写作从来都不只是把已经想好的内容敲出来这么简单,写作的过程本身,就是梳理思考的过程。
一个句子要怎么措辞、一段论证要怎么推进、一个比喻要怎么选择,这些选择都在逼着写作者搞清楚,自己到底想要说什么。当我们停下敲键盘梳理思绪的手,这个厘清思路的过程也就跟着停止了。
纽约大学数字人文中心主任Leif Weatherby在《语言机器》一书中提出了一个十分尖锐的观点:机器已经可以在完全没有理性参与的情况下生成语言,语言和理性已经被彻底拆分开了。
他认为,冷战结束之后,「人文学科已经把语言这块阵地拱手让给了认知科学和计算机科学」。
这段话听起来很学术,但落到每个人的生活里其实是非常具体的事:当ChatGPT帮你写完周报、帮你回完工作邮件、帮你编好朋友圈文案的时候,省下来的那些时间里,真的有人会用来做深度思考吗?还是说,我们连思考本身都一起省掉了?
意大利作家卡尔维诺早在1967年就期待过一种「真正的文学机器」,期待它能自发制造混乱、催生创造力。
但到今天,大语言模型生成的文字哪怕再精巧、再流畅,底色终究是派生的、平均化的、可预测的。用德国哲学家马克斯·本泽的话来说,这就是「没有诗人的诗」。
AI的训练养料,正在慢慢枯竭
人类思维的萎缩只是问题的一半,另一半问题更隐蔽,也更致命。
大语言模型的能力,本质上来自人类产出的海量文本。
互联网上几十年来积累的文章、论文、小说、论坛帖子、代码注释,共同构成了训练大模型的核心原材料。
当越来越多新内容变成AI生产而非人类原创,这些宝贵的训练养料正在被不断稀释。
这个问题在学术界已经有了专属名字,叫做「模型坍缩(model collapse)」。
2024年,《自然》期刊发表的一篇论文指出:如果AI模型反复用自己生成的数据训练,输出内容的多样性和质量会逐代下降,最终会坍缩成毫无意义的噪声。
https://www.nature.com/articles/s41586-024-07566-y
这个逻辑和近亲繁殖导致基因退化的原理几乎完全一致。
更可怕的是,这两个问题还会互相加速,形成一个停不下来的恶性循环。
AI产出越多,人类写得就越少;人类原创越少,AI能学习到的新鲜养料也就越少。
养料枯竭会让AI的输出越来越同质化,而同质化的内容又会进一步打消人类亲自书写表达的动力。
这个循环一旦转动起来,想要停下来就非常困难了。
Graphite的研究数据也印证了这一点:虽然从2024年5月开始,AI文章的占比就基本稳定,没有继续大幅飙升,但这恰恰说明,容易被AI内容占据的领域已经被填满了,剩下的人类内容阵地,也正在被AI逐步渗透。
未来终局会走向何方?
如果把视野拉到更远的未来,通用人工智能乃至超级人工智能的终局会是什么样子?
乐观派认为,一旦超级智能诞生,它就会拥有自主学习和创造的能力,根本不需要人类文本做训练素材,刚才说的这个恶性循环自然就会瓦解。
而悲观派则认为,在超级智能到来之前,人类可能已经在思维层面严重退化,变成了高度依赖AI输出的物种,到那个时候哪怕超级智能愿意和人类交流,人类也已经没有足够的理解力接住它传递的信息了。
其实这两种推演都可能太极端了。
真正值得警惕的,是一种温水煮青蛙的中间状态:AI没有强大到取代所有人类思维,但已经强大到让大多数人主动放弃了独立思考的习惯。
这个世界的语言不会彻底消亡,但会变得越来越同质化、越来越平庸,越来越难出现那些只有人类在费力组织语言的时候,才会迸发出来的意外灵感和独特洞见。
吉尔·莱波雷引述Leif Weatherby的话说道:「一件影响深远的大事正在发生,我们终于能和机器对话了。但我们至今还没有找到语言,来描述这个根本性的转折。真正的问题是,这段历史本应该由人类来书写,但到目前为止,写出来的内容本身就只是一堆垃圾slop。」
维特根斯坦说,语言的边界就是世界的边界。
那么,如果一种语言的生产者从碳基人类换成了硅基AI,我们这个世界的边界,究竟是在拓展,还是在收缩?
罗尔德·达尔在1953年就写下:英语世界一半的小说已经出自机器之手。
「这会让你惊讶吗?」他问道。
到2026年的今天,这句问话本身,早就已经不带任何修辞色彩了。
编辑:马可
秒追ASI
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com





