喂养AI大模型的小镇青年:数字时代的隐形劳动者
本文来自微信公众号:动察Beating,作者:?
山西大同,这座曾以煤炭为支柱的城市,如今洗去煤灰,将目光投向了无形的数据矿山。
平城区金贸国际中心的写字楼里,没有了升降井与运煤车,取而代之的是上千个电脑工位。上海润迅云中声谷大数据智慧服务基地占据数层楼,数千名戴耳机的年轻员工盯着屏幕,重复着点击、拖拽、框选的动作。
官方数据显示,截至2025年11月,大同已投运服务器74.5万台,引进69家呼叫标注数据企业,带动超3万人次就近就业,产值达7.5亿元,94%从业者为本地户籍。
不止大同,国家数据局首批数据标注基地中,山西永和县、贵州毕节、云南蒙自等中西部县城也在列。永和县基地80%是女性员工,多为农村宝妈或返乡青年。
百年前英国曼彻斯特纺织厂挤满失地农民,如今偏远县城的电脑前,坐着在实体经济中难寻位置的年轻人。他们从事着看似未来感却原始的计件工作,为北京、深圳和硅谷的AI巨头生产大模型所需的数据“饲料”。
没人觉得这有何不妥。
黄土高原上的新流水线
数据标注的本质是教机器认知世界。自动驾驶需识别红绿灯与行人,大模型要分辨猫和狗,机器无常识,需人类在图片上画框标注,它才能通过千万张图学会自主辨认。
这份工作无需高学历,只要耐心和灵活的食指。2017年黄金期,一个简单2D框能卖一毛多,甚至有公司开5毛高价,手速快的标注员一天干十几小时能赚五六百,在县城算高薪体面工作。
但大模型进化后,流水线的残酷性显现。2023年,简单图像标注单价跌至3-4分钱,跌幅超90%;难度更高的3D点云图,标注员需在三维空间拉立体框包裹车辆或行人,一个复杂3D框也仅5分钱。

单价暴跌直接导致劳动强度剧增。为保住每月两三千底薪,标注员需不断提升手速。这并非轻松白领工作,许多基地管理严苛,上班不能接电话,手机锁进储物格,系统记录鼠标轨迹和停留时间,停超三分钟就会收到警告。
更崩溃的是容错率,行业及格线常超95%,有的公司要求98%-99%,拉100个框错2个就需返修。动态图连帧、车辆遮挡需联想找出;3D点云图超10个点的物体必须画框,复杂车位项目易因线长、漏标被质检挑错,一张图返修四五次是常态,一小时工作可能仅赚几毛钱。
湖南一位标注员晒出结算单,一天拉700多个框,单价4分,总收入30.2元。
这是割裂的图景:一边是发布会上科技大佬畅谈AGI解放人类;另一边是黄土高原和西南大山县城的年轻人,每天盯屏幕8-10小时机械拉框,甚至做梦都在画车道线。
有人说,人工智能外表是豪车,打开车门却有一百人骑自行车拼命踩踏板。
没人觉得这有何不妥。
教机器“如何去爱”的计件工
图像识别瓶颈突破后,大模型向深层进化,需学会人类般思考、对话,甚至展现“同理心”,催生了核心且昂贵的RLHF(基于人类反馈的强化学习)环节。
简单说,就是真人对AI回答打分,告知哪个更符合人类价值观和情感偏好。ChatGPT“像人”,正因背后无数RLHF标注员的“教导”。
众包平台上,这类任务明码标价3-7元/件,标注员需对AI回答做主观情感打分,评判是否“温暖”“有同理心”“照顾情绪”。
拿着两三千月薪、在现实中疲于奔命的底层打工人,要在系统中担任AI的情感导师和价值观裁判。

他们需将温暖、同理心等复杂人类情感量化为1-5的分数,若打分与系统标准答案不符,就会因正确率不达标被扣微薄工资。这是认知抽空,人类复杂情感被拖入算法漏斗,在量化刻度中失去温度。当人们惊叹AI会写诗谱曲、嘘寒问暖时,屏幕外的标注员却在机械判断中退化成无情绪的打分机器。
这是产业链最隐秘的一面,从未出现在融资新闻和技术白皮书里。
没人觉得这有何不妥。
985硕士与小镇青年
底层拉框工作被AI碾压,赛博流水线向上蔓延,吞噬高阶脑力劳动。大模型不再满足于简单常识,需吞噬人类专业知识和高阶逻辑。
招聘平台频繁出现“大模型逻辑推理标注”“AI人文训练师”等兼职,门槛高,要求“985/211硕士及以上学历”,涉及法律、医学等专业领域。

名校研究生被吸引涌入外包群,却发现这是精神折磨。接单前需阅读几十页打分标准,经两三轮试标,正式标注中正确率低于平均水平就会被踢群。更窒息的是标准不固定,相似问题和回答用相同方式打分结果可能相反,像做无标准答案的试卷,无法通过努力提升正确率,只能消耗脑力体力。
这是大模型时代的新型剥削——阶层折叠。知识曾是打破壁垒的阶梯,如今沦为算法的复杂“草料”。在算法和系统权力面前,985硕士与小镇青年殊途同归,一同跌落赛博矿坑,被剥夺光环、抹平差异,成为履带上廉价可替换的齿轮。
国外也如此,2024年苹果砍掉圣地亚哥121人的AI语音标注团队,他们负责改善Siri多语言处理,曾以为在核心业务边缘,却瞬间失业。在科技巨头眼中,县城拉框大妈和名校逻辑训练师都是可替换的“耗材”。
没人觉得这有何不妥。
万亿巴别塔,砌满几分钱的血汗
中国信通院数据显示,2023年中国数据标注市场规模60.8亿元,2025年预计200-300亿元,2030年全球市场销售额将达1171亿元。这些数字背后是OpenAI、微软等巨头数千亿、万亿美元的估值狂欢,但财富未流向喂养AI的人。
中国数据标注行业呈倒金字塔外包结构:顶层是握核心算法的科技巨头,第二层是大型数据服务商,第三层是各地标注基地和中小型外包公司,最底层是拿计件工资的标注员。每一层外包都刮走油水,大厂5毛单价经层层盘剥,到县城标注员手中可能不足5分。
希腊前财长雅尼斯·瓦鲁法基斯在《技术封建主义》中提出,科技巨头是“云领主”,拥有算法、平台、算力等数字领土,用户是数字佃农,社交媒体上的互动都是免费上供数据;下沉市场的标注员是最底层数字农奴,需生产、清洗、分类、打分数据,转化为大模型的高质量饲料。
这是隐秘的认知圈地运动,如19世纪英国圈地运动将农民赶进纺织厂,如今AI浪潮把实体经济中难寻位置的青年赶到屏幕前。AI未抹平阶层鸿沟,反而建立了从中西部县城到北上广深科技巨头的“数据与血汗输送带”,技术革命的底色是廉价劳动力的规模化消耗。
没人觉得这有何不妥。
不再需要人类的明天
残酷结局加速到来,大模型能力跃升,曾需人类日夜劳作的标注任务正被AI接管。2023年4月,理想汽车创始人李想透露,过去一年需1000万帧自动驾驶图像人工标定,外包成本近一亿,用大模型自动化标注后,一年的事3小时就能完成,效率是人的1000倍,2024年3月理想还发布了新一代自动标注引擎。
行业自嘲“有多少智能,就有多少人工”,但大厂数据标注外包投入已断崖式下降40%-50%。小镇青年们亲手喂大的巨兽,正在砸掉他们的饭碗。
夜幕下大同平城区写字楼依旧明亮,交接班的年轻人在电梯间沉默交换疲惫。在多边形框禁锢的折叠空间里,没人关心Transformer架构的跃迁,也听不懂千亿参数的算力轰鸣,他们的视线只焊死在后台的“及格线”进度条上,算计着计件数字能否拼凑起体面生活。
一边是纳斯达克敲钟声与AGI降临的庆祝;另一边是喂大AI的数字农奴,在酸痛睡梦中等待巨兽踢飞饭碗。
没人觉得这有何不妥。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com





