谁应该成为大模型成长的“养分”?

2024-08-04

有关“AI即将取代人工”的言论沸腾了,并且不再局限于科技幻想,而是真正进入了现实世界。


首先,萝卜跑得很快,引起了大量网络汽车司机的不满。然后,番茄小说《AI作者》一日三本书让网络作者处于危险之中。


然后,与番茄小说同属字节跳动的“豆包”被曝光与电影院小说素材同步,以“喂养”番茄的AI作者。更有意思的是,这一事件已经蔓延到在线文档领域。据悉,有网友在社交平台上表示,豆包的收藏范围不仅在网络文学领域,还在网络文档中延伸到作者尚未发布的内容。


其中,WPS首当其冲。


因此,WPS官方不得不紧急辟谣。然而,除了WPS,大多数在线文档应用程序都经过了一些审查,包括石墨、腾讯文档、印象笔记、墨客和橙瓜...最后,很多人发现,当AI出路时,互联网时代到处都是不安全的。


这不是胡说八道。去年,WPS被曝在用户协议中增加了AI培训规则。虽然这两年官方一直在争论谣言,但很多用户还是不愿意信任,“罗生门”剧就上演了。


用户担心自己辛苦创作的内容会成为别人的婚纱,而AI背后的资本则想成为“普罗米修斯”,为大模型收集“火源”。


网上文档,集体奔向AI。


近年来,网络文档面临着研发停滞、用户流失、同行内卷、广告收入疲软等诸多压力…


网络文档遇到创新疲软是不争的事实,作为行业代表,WPS也难逃这种困境。在进入AI之前,WPS最高调的创新还在2018年。起初,腾讯文档的出现让WPS感到焦虑。前者上线三个月后,后者宣布升级。


特别是增强了多人合作功能,WPS曾经把这部分独立拿出来。但是到目前为止,云协作已经无处不在,像飞书、钉钉、企业微这样的企业APP已经无处不在。、像石墨这样的在线文档玩家,甚至各种云办公文档小程序都可以做到。


值得一提的是,前几年外部环境造就了一波线上办公热潮,大量线上文档应用间接火了。其中,印象笔记、石墨文档等少数玩家的知名度急剧上升。数据显示,2020年线上办公爆发初期,印象笔记的C端用户数量增加了四五倍,石墨文档的新用户数量增加了公司注册数量的6倍左右。


同一年,腾讯文件宣布月活突破1.6亿后,内卷开始成为行业生态,整个市场也逐渐陷入长期瓶颈。


在大模型爆发之前,情况开始发生变化。


根据2023年的财务报告,WPS 国内Office个人办公服务订阅收入达到26.5亿元,同比增长近30%,月活设备数量达到5.98亿元。


在线文档使用AI已成为一种不可避免的趋势。根据艾媒咨询数据,随着大语言模型和AIGC的大规模应用,AIGC 协同办公场景将有效推动行业增长,预计2023年协同办公市场规模将达到330.1亿元


AI已经成为在线文档稳定市场地位、留住用户的重要手段。WPS更渴望进入AI。因为在ChatGPT走红之后,在线办公市场被认为是最方便的落地场景之一,当OpenAIGPT-4刚刚发布的时候,隔壁微软就结合大语言模型LLM推出了Microsoft。 365。


一直以来,WPS Office都是针对微软Office的。公开资料显示,微软Office和WPSS Windows平台Office在国内市场的平均市场覆盖率分别为81.5%和68.7%。在PC端,微软Office领先一步,而后者在移动端更具优势。


不可否认,微软对AI的规划强烈刺激了WPS。需要注意的是,WPS绝不是唯一开始关注AI的公司。从国内公司来看,百度有一个智能办公平台,钉钉背靠通义千问,印象笔记发布“印象AI”,飞书发布“My AI”……


巨头们想通过上一段楼梯来利用AI。那些没有足够资金进入AI的小众玩家,也开始在曲线上拯救国家,选择与大厂合作。这也是这次“豆包盗文”导致在线文档圈集体沦陷的由来。


一般来说,在线文档正在热情地奔向AI。无论谁先赢,承担“喂养”任务的用户都成了最无辜的人。当他们轮流在不同的平台上奔跑,试图避开这一步时,他们悲伤地发现自己似乎无处可逃。


大型训练背后的“原罪”


据报道,百度的文心一言为85,000家企业客户服务,阿里的通义千问为90,000家企业客户服务,截至2024年5月15日,字节豆包总下载量超过1亿,双端月活破2600万...


当大模型火爆时,AI训练自然受到外界的关注。公开资料显示,大模型训练步骤一般分为数据采集和处理、模型设计和测试、模型训练、评估和优化以及模型部署和维护五个步骤。


在这些步骤中,第一步尤为重要。而且正是这一步,造就了豆包,WPS 像AI这样的争议很多。


数据是大模型训练和进化的基础,但在AI发展过程中,信息源是否合规成为本赛道未来是否可持续的前提,否则版权、隐私等疑问群体将接踵而至。在AI激怒了网络作者之前,就已经有了画手圈的例子。


去年年底,小红书AI绘画模型Trik被国内几位画家联合起诉。原因是Trik未经授权使用画家的原创作品作为训练数据,生成了与原创作品高度相似的图片,侵犯了创作者的合法权益。360创始人周鸿祎也因涉及“AI盗图”而受到全网嘲讽。


海外也是如此。据报道,有16000名英国艺术家联合起诉OpenAI和其他人工智能公司。甚至NYT也向法院起诉OpenAI和微软侵犯版权。


在科技创新的历史征程中,似乎我们在享受科技成果之前,总要付出一些“看不见”的代价。但是谁来承担这个成本值得探讨。


其实大模型培训之所以把触手伸向普通人,归根结底是因为公司开发大模型的成本居高不下,投入实用后无法获得可观的利润。目前,OpenAI、Midjourney、文心一言,讯飞星火大模式虽然都已经开启了付费模式,但是,大模型企业要进入盈利阶段还有一段距离。


以OpenAI为例,调查显示,虽然今年前两个季度的收入不错,年收入往往增加到34亿美元,但由于建立和运行模型的高成本,损失状态并没有得到改善;ChatGPT会员的付费收入已经达到50%以上,但偏向于企业和开发者的API收入只占15%左右。


在国内这里,Kimi目前的推广费用仍然在12元以上,WPS AI总结一个万字文档,导出千字摘要,仍然需要2.64元...但是行业内的价格战却突然开始了。以前,GPT-4o 每100万Token的输入/导出分别为15元/60元,mini正式上线。


大模型界在这种背景下呈现出精彩的“众生相”:受到侵害的用户义愤填膺,成本和收入不对称的企业进退两难,而资本则开始生出离场的念头。根据PEVC数据,2024年第一季度,人工智能领域共有198起融资案例,同比下降20.80%。


在过去的历史经验中,当技术进步与社会道德发生冲突时,科技发展总是被视为某一方面的“原罪”,但真的是科技应该承担原罪吗?


创新与制约同存


关于人工智能是否可以取代人类,这个问题起源于科幻电影时代。随着大模型掀起全球科技热潮,似乎除了戏剧性之外,还增加了很多概率。萝卜快跑引起了很多司机的抗议,网络作者联合上书抵制西红柿,这已经成为现代科技文明史上的开始。


7月6日,2024年世界人工智能大会在上海落下帷幕,金融、教育、医疗成为重点应用落地方向。实际上,ChatGPT 在发布的时候,海外有人专门统计了一下“哪些工作更有可能被录用?” AI 取代”。


在Upwork(世界上最大的自由职业平台)中,一位博主统计了ChatGPT 发布前一个月到 2024 年 2 月 14 一些日常自由职业工作数据。调查显示,ChatGPT 的影响,Upwork 写作、翻译、客户服务是上波及最大的圈子。在这些人当中,翻译成了AI替代的重灾区,工作量下降了19%,时薪也下降了20%。


然而,在这些支持人工智能抢人类“饭碗”的数据表象背后,却有着相反的趋势:从宏观角度来看,许多工作都是由于ChatGPT。 反而更多地出现了。


统计数据显示,特别是以大模型为核心的创意工作,获得了AI的第一波“收益”。Upwork 上,ChatGPT 发布后,视频编辑/制作工作数量增加。 平面设计工作提高了39%。 8%,网页设计工作得到加强 10%。软体开发工作也有所增加,后端开发工作也有所增强。 6%,前端/网页开发工作得到加强 4%。


科学技术的双面性凸显出来。AI不是每个人都在喊打。至少在保护用户基本利益的前提下,落地到具体生活的好处远远大于缺点。中国也是如此。比如2023年,AI翻译了20%从阅读起点出海的网络作品。


AI应用引起的争议问题当然从未消失。


除了网络作者和画家质疑版权之外,学术界的大模型论文热也穿透了这一领域的落地意义。以《中国医学杂志》为例。自去年7月以来,该杂志发现AI生成的论文数据每月都在上升,一度超过50%。


目前,《中国医学杂志》已经发布了AIGC技术使用的相关规定,可以退稿或撤稿;情节严重者将被列入作者学术失信名单。


从这些案例中,我们不难看出,一些行业已经意识到AI应用应该按照一些必要的规则进行。我们之所以面对各种在线文档,是因为目前的AI标准还没有到位。


所以,官方出台的相关政策也越来越多,国内有《生成式人工智能服务管理暂行办法》、在国际上,欧洲议会今年3月通过了《人工智能法案》等...如何在不抹杀创新的情况下,合理培养大模型,使用大模型,正在成为整个行业的新节点。


各种迹象表明,大模型的出现是人类科技文明纪念碑上不可磨灭的符号,也是一项沉重的责任,需要大量的人主动承担。


对谁应该成为大模型增长的“养分”,当然不能只让普通用户成为唯一的代价。


道总有理,曾经用名歪道道,互联网和科技圈新媒体。同名微信微信官方账号:道总有理。(daotmt)。本文为原创文章,拒绝以任何方式转载作者相关信息。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com