985硕博也难逃?我们竟成AI的人肉标注师?
在助力AI成长、却可能终结自身职业的道路上,人类的内卷程度究竟已达何种境地……
文|谢红婷
编辑|方婷
AI需要经过标注的数据来更好地理解人类世界,而那些高薪的数据标注员,正是负责这一环节的工作者。难道人类中最聪慧的一批年轻人,真的在协助AI,亲手断送自己的未来?
恰好,作为一名正经985毕业的“过来人”,我亲身去面试了这些传说中月薪过万的数据标注岗位,带大家一探究竟。
请观看36氪原创视频
??也欢迎关注36氪视频号??

朝九晚六,不加班不驻场
毕业即月薪过万
海投简历后,我在一栋老旧写字楼里见到了一位招聘负责人。她告知我,我应聘的岗位是某大厂的外包职位,好处是无需真正进入大厂“高压工作”。
工作时间朝九晚六,不加班、不驻场,难度说大不大、说小不小。

在数据标注行业里,拉框、声纹识别、教AI分辨猫狗、语音转文字等基础任务,难度如同“儿童启蒙”,特点是成本低、需求量大,只要有手就能做。
国外科技大厂通常将这类工作外包给菲律宾、肯尼亚的从业者,国内二三线城市也有类似的“零工岗”“AI扶贫岗”。

而需要985、211毕业生参与的数据标注项目,则属于“高阶挑战”级别。不仅要充当AI的“判官”,指出其生成内容的不当之处,还得在专业领域内绞尽脑汁给AI出题。
问题清晰有条理只是基本要求,而且你出的题目,市面上主流模型最多只能答对40%——换句话说,你得想办法难住AI。所有努力都是为了让AI的回答从40分提升到80分,让它更理解人类思维模式,变得更聪明。
一位“文生文”项目负责人对这项工作做了更详细的解释:

“我们需要给模型设定考点或参考答案,答对就能得分。当前大模型的培育主要用check list(结构化评判标注),现在也在向rubric(评分标准)进化。如果说check list是60分的参考答案,那rubric可能是80分甚至100分的标准。所以培训期我们会花大量时间,专门教大家如何撰写check list。”
如此复杂的任务,薪资结构是底薪8000元,绩效最高可达6000元。大部分人能拿到中间档的3000元绩效,综合薪资超1万元。
说实话,对985文科刚毕业生来说,1万多的月薪确实有竞争力。负责人直接表示我的学历符合要求,可以进入下一步“试标”环节,通过7-10天的培训考核就能正式入职。

给AI当“老师”改作业
它变聪明了,人却麻木了
随后,我们找到了曾在大厂外包数据标注岗工作半年的渊星深入了解。作为科幻作者,他加入的是小说组。

渊星的主要工作是让模型写短篇小说。在特定测评项目中,他会针对同一指令让5个大模型作答,每个模型能写一万字甚至更多,加起来总量达几万字。这些海量内容都需要标注员仔细审阅评估。
看大神写的网文是一回事,看AI写的网文完全是另一回事。
这就像老师批改作文,只不过五个“学生”都是AI。哪里有语病?逻辑结构是否合理?这些标签都得标注清楚,还要选出最佳创作,亲自给AI示范什么是真正的“人情味”。整个过程堪称折磨。
渊星的真实感受是:AI写的内容大多很糟糕。时间一长,自己也会严重消耗,旁人觉得很“AI化”的表达,他坦言已经看不出区别:“至少上班时,我完全没有创作欲望,每天看AI写的东西就够折磨了。”
关键是一番折腾后,到手的钱远没想象中多。

因为绩效和标注量挂钩,并非每条数据都能通过质检专家和算法工程师的检验。你觉得AI回答能给80分,质检可能只给60分,数据需要返修,标注量就很难提上去。
给AI当“人肉电池”,消耗远超想象。无论985、211学历,还是大厂机会、AI风口这些光鲜标签,都掩盖不了该岗位处于AI产业链下游的事实。
在渊星看来,标注员无法直接接触产品和算法。规则制定、任务下发由产品和项目经理对接,再传达给标注员。他直言:“就像项目经理更高贵,标注员就低人一等,连和他们同会议室开会的资格都没有。”
面试我的HR直接说,如果只做标注,无非是从一个项目跳到另一个,没有晋升空间。但她也认为“给AI打螺丝”的说法太悲观,安慰道:“标注员更像老师,模型能否变聪明、给用户的体验如何,根源都在于数据质量的好坏。”
只是对一线标注员而言,“模型变聪明”和自己有没有关系,很难感知到。更多人和渊星一样,觉得自己在做无用功。

每个人,
都在参与投喂AI的“义务劳动”
在加州工作的研究生Jiayi,从事图像数据标注已有一年半,她也有类似困惑。

她表示,目前的工作中,自己完全不知道接触的数据训练会产生什么后续影响:不清楚目标是什么、服务于哪台机器,更不觉得能学到实用技能。
名校生精心标注的数据,对AI进化而言,就像聚沙成塔中的一粒沙。AI建起了前所未有的高塔,人类奉献的每粒沙都重要,但身处其中的“沙子”,很难看清自己对整体的意义。
高质量数据集是人工智能研究的核心。
被称为“AI教母”的李飞飞,2009年推出ImageNet数据集,包含1500万张图片、覆盖2.2万个类别。帮助她完成这一庞大工作量的,是通过亚马逊众包平台(Mechanical Turk)接单的4.8万名零工。
对数据质量的重视让AI越来越聪明,给AI当“老师”的人也开始被层层筛选,卡学历只是开始。数据标注早已从劳动密集型产业,变成门槛不断抬高的“赛博流水线”。

从一线标注员升为项目经理的Leon透露,他在某大厂后期的主要工作目标,是通过自动化PE workflow agent,实现自动评测或标注。
AI正进化到能自我训练,在这场轰轰烈烈的硅基进化中,哪怕是最昂贵的碳基大脑,或许也注定是完成技术闭环的燃料。
实际上,每个使用AI的人,都在参与这场投喂AI的“义务劳动”。
你与AI的每一次对话,都可能成为数据标注员评测和精标的素材。AI回应你后,你的每一次追问、纠正、选择,都在告诉它人类真正想要什么。
未来,我们和AI会互相引导走向怎样的终局?
没人知道。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com



