使得企业为大模型买单,目前有四大难题。

2024-07-03

2024年初,酱香酒企肆拾玖坊在经销商群中投放了一款大型聊天机器人。


群聊机器人不是什么新鲜事,但大模型是时尚技术。九坊是葡萄酒公司的新兵,成立于2015年。与传统葡萄酒公司相比,公司规模小,但对新技术敏感。九坊CIO(首席信息官)张鹏告诉我们,经销商对葡萄酒公司来说太重要了,他们希望通过大模型的自然语义交互功能来提高对经销商的服务能力,达到增加销量的目的。


忙碌了一段时间,张鹏有点失望,“大模型加持的机器人就不一样了,特能说,可以提供比闺蜜更多的情感价值,但这不是商业价值。


大型落地公司主要有两种方式。一种是公司私有部署的大模式,可以保证企业的数据安全,但部署成本高达数百万元,适用于金融、电信、能源等数据敏感行业。另一种是调用厂家的大模型API(应用程序编程接口),成本低,主要由输入输出的Token(模型可以理解和生成的最小单位,可以收取一个单词、一个数字或一个标点符号等。).部署方法简单,适用场景更广。


九坊主要采用低成本的API调用方式。试点后,公司发现大模型对业务价值有限,决策者对后续大模型的探索趋于传统。


我们和十几个分散在各行各业(主要是相对传统的行业)的头部公司CIO交流了大模型的落地情况,得到了两个反馈:


第一,大模型作为目前被认为是最重要的创新技术,确实受到公司的重视。他们想通过大模型技术解决痛点需求场景的问题,给企业带来实用价值,如降低成本、提高效率、提高质量、拉动需求、创造利润等。


第二,目前大模型技术主要在单点、小场景落地,难以给整个业务带来直观的效益。 一位头部咖啡连锁品牌首席技术官表示,大模型只能锦上添花,不能雪中送炭。


目前,大多数企业落地大模型的障碍包括但不限于以下四点:商业价值明确的落地场景有限、模型落地工程化能力不足、行业和场景大模型不完善、企业内部对大模型认知不足。


中观数据侧面支持上述反馈。国联证券对a股所有公司2023年的财务报告进行了核实,883家上市公司提到了生成式AI业务。落地公司集中在TMT和大市值公司(Technology技术、Media媒体、Telecom电信)行业。超过一半的一级行业渗透率不到10%,a股上市公司整体渗透率不到20%。


从结果来看,先行公司探索的落地场景有限,重点是虚拟人、客服问答、营销文案、平面设计、代码生成、知识库、智能助手等。这些场景与企业核心业务关系不大。由于大模型产生的内容与培训数据和提示的质量密切相关,上述典型场景的大模型落地效果也非常不同。


大多数率先落地大模型技术的公司都是技术敏感、数字化基础完善的公司,其他公司要落地大模型就要补上这两课。各行各业普遍讨论大模型,落地较少。医药流通行业一家龙头企业的副总经理告诉我们,对他来说,2024年并非所在行业的大模型落地第一年:人才、认知、技术不足。


换句话说,目前大模型正在接近数字化的自然行业,更多的传统行业仍在观望。这符合新技术推广规律,也给科技公司带来了时代命题——如果大模型真的是一项能够促进产业创新的大技术,它应该如何在更广阔的行业轨道上着陆?


"我不会为玩具买单"


一般来说,企业落地大模型的过程分为三个步骤:


首先,IT团队整理了市场上关闭源模型的性能特点。不同的模型有明显的差异,有些语义理解能力强,但对数据和时间不敏感;有些逻辑判断力强,但语言表达不够好;其他英语情景能力强,中文情景能力差...


二是识别各业务线的痛点,即大模型技术与项目需求的交叉点。


三是对具体大模型的适应情况进行评估。


因此,R&D团队需要制定技术预算,投入人力资源,协调跨部门合作。但即便如此,大模型落地后的业务也未必能获得更多的商业价值。


智谱AI相关负责人告诉我们,经过一年多的发展,国内企业客户从2023年开始关注参数和榜单,到2024年,他们更加关注价值转换,即企业端的需求已经完成了从“模型为王”到“商业价值为王”的转变。它要求企业找出大模型、企业情况和业务节点的最大公约数。


这不是一件容易的事情。据张鹏分析,其经销商群中的聊天机器人属于营销工具。大型产品升级后,聊天机器人的语言表达更加自然,但仍然没有销售人员的主动服务和专业素养。其核心功能是同步产品价格、渠道等信息或行业通识知识。与上一代问答机器人相比,整体能力有所提升,但业务价值不明显。


起初,张鹏选择了聊天机器人落地大模型技术,因为营销场景可以直观地评估商业价值转换。但从结果来看,这一场景的投入和产出“达不到预期”。


上述头部咖啡连锁品牌CTO认为,目前大模型技术在业务中显示了一些高效工具的价值。该公司将大模型引入营销、客户服务和内部培训场景,大模型在辅助文案和设计创意方面发挥着“一些作用”。但他对效率价值的评价是相对的,业务价值对于企业来说更为重要。 所以,他对后续大模型落地的优先级排名并不高。


许多工业企业的首席信息官告诉我们,他们希望模型制造商提供更多关于大模型着陆的基准案例。然而,国内头部制造商的主要精力是突破底层大模型,以追求海外企业。他们通常每三个月迭代一次底层大模型的节奏。因此,大多数模型制造商与公司沟通时,主要是销售技术,而不是提供行业解决方案。


企业落地大模型的一个误区就是优先考虑大模型的能力,用锤子找钉子。但现实是,并不是所有的应用都可以通过重做大模型来产生商业价值。


2023年初,海底捞开始接触大型模型技术。和大多数企业一样,当时他们遵循外界对大模型的普遍印象,一键引入营销文案生成、飞书问答机器人等场景。海底捞信息技术部产品负责人杨炫之总结,“偏玩具、偏试验”在那个阶段的应用对业务帮助不大。


要找到价值场景,企业往往需要一段时间的探索。海底捞直到2024年初才取得进步。杨炫之总结,大型模型适用于与成熟的小型模型相结合,重复性劳动的场景。


一个典型的场景是,2024年初,海底捞将大模型技术引入中央仓库物料识别阶段。中央仓库是海底捞商店商品的集中场所,接收来自世界各地的商品。商品的语言、印刷包装有很大的不同。OCR(光学字符识别技术)曾被用于中央仓库。它是一种技术识别和提取材料的生产日期、保质期、制造商等信息。通过扫描和识别图像中的文本信息,并将其转换为可编辑和搜索文档格式的技术。然后,人工对信息进行分类,将材料信息整理成系统可识别的格式文档,分发给集团公司的上下游单位。


根据杨炫的解释,OCR是一个解决信息识别和提取问题的小模型,后续的信息分类是人工重复的劳动场景。人工信息分类存在翻译标准不统一、耗时、成本高的问题。在此之前,海底捞中央仓对一条中文物料信息进行分类的费用大约是五毛钱,对一条外语物料信息进行分类是八毛钱。现在接入大型自然语言理解能力之后,这项工作就可以交给系统高性价比的完成。


只有少数公司可以像海底捞一样花一年时间尝试不同场景的大模型。大多数民营企业在经济逆风的背景下降低了创新预算。如果在模型落地初期选择了错误的需求场景,公司的探索就会尝到。


自2024年5月以来,国内大型模型制造商集体宣布将降低获取模型API的价格,即降低企业探索大型模型的落地成本,吸引更多企业加入大型模型应用的创新生态。


国内一些大型头型厂商的核心人士评论说,降价不是为了打价格战,而是为了吸引客户。事实上,大型落地科技公司已经迈出了第一步。从其他行业的角度来看,很多企业还没有达到为大型模型买单的阶段。


新型武器,难上手


在江湖世界里,人剑合一是达到武术最高水平的标志。在模型浪潮中,只有将大模型融入到企业的业务和发展中,才能发挥想象中的力量。这意味着公司的系统和数据应该与大模型充分融合。这极大地考验了公司数字化建设和工程研发的能力,基础不足的公司连这种新武器都买不起。


具体来说,公司的核心业务落地大模型有两个前提。第一,企业建立了数字系统,可以在多个系统之间打通,实现相互操作。第二,企业可以整合和管理内部数据。


前一种测试公司过去的数字化建设水平,只能通过OA(办公自动化系统)、ERP(企业资源规划系统)、MES(制造执行系统)、CRM(客户关系管理系统)等内部管理工具和生产工具的企业可以为大型落地提供便利。


后者要求企业发掘大量散落在各个地方的Excel、CSV、XML等格式结构化数据和非结构化数据,如音频、视频、图片等。,并完成数据的清洁、预处理、标记和向量化处理。只有这样,大模型才能理解和使用公司的数据。


长期以来,IT部门在工业企业中主要承担采购的角色,很少承担具体的开发工作,为需求场景选择和采购合适的技术解决方案。IT部门可以通过高价购买外部服务来完成公司的数字系统建设,但大模型也对企业提出了新的要求——如何将公司原有的数字基础与大模型相结合,如何将专业人士对需求场景的认知转化为知识库和知识管理,这些都需要大量的项目工作。


目前大模型落地快的企业大多在智能投资时间长、投资大的企业。他们的数字化基础比较完善,模型厂商愿意为这些少数头部企业提供个人定制服务。


然而,千行百业是一家规模较小、年投资数字化资金有限的公司。他们的数字化建设和工程开发能力落后,需要个人的工程定制服务才能用好大模型。 但由于成本控制、精力有限等原因,大型厂商无法考虑这部分需求。


它是当前大模型落地的痛点,也是未来的机遇。——大型落地,需要一群第三方开发服务商。


一家消费领域龙头企业的数字负责人告诉我们,美国有很多软件行业在实践大模型场景的工程服务业务,但这种生态在中国仍然存在缺陷。现有的服务提供商集中在模型私有化部署领域,而对大模型API调用的深度使用关注不够。同时,无论是哪种落地方式,工程化解决方案将大模型与企业价值场景相结合并不成熟。


缺乏相关的解决方案会使公司只能在单个业务节点访问大型模型,而很难在更复杂的业务场景中应用大型模型。


蒙牛落地大模型的进展在国内企业中处于第一梯队。从2022年下半年开始,其数字智能团队接触并实施了大模型技术。蒙牛首席数字智能官员李邈洁告诉我们,一套大模型落地方法论已经沉淀在公司内部。


蒙牛队建立了“1” AI技术底座2”。AI基础设施是AI基础设施,可以高效、高性能地调度多模型,保证服务合规性和数据安全性。2是公司的大脑和知识银行。在这些模型中,公司大脑负责串联、调度大小模型,通过API接入和调用业务中台的现有能力,实现企业内部系统的开放。在深入挖掘企业数据后,知识银行将数据进行量化处理,使其成为AI友好的知识,积累和管理蒙牛的行业知识。


AI以上的技术底座 Agent 低代码平台Builder允许业务人员通过拖拽快速构建AIlder。 Agent(软件实体具有一定的智能性,能够在客户的指导下独立或完成特定的工作)赋能特定的需求场景。如果企业只能在单个节点使用大型模型,李邈洁告诉我们,它所能产生的价值并不大。就拿营销场景来说,蒙牛完成了大模型协助营销投放决策和实施的端到端流程提升。


在内容策略方面,大模型将结合社会媒体热点、品牌和商品信息,自动生成创意概念和内容框架。具体营销内容的形成,就是综合传播平台定位、帐号定位、关键字策略等参考因素。在投放群决策中,大型模型基于投放目标、投放预算、媒体特征和目标群体等自动推荐。在投放效果分析方面,大模型将根据行业和蒙牛过去的经验、舆论声量、投放目标等,生成效果评价。


整个过程激发了Agent知识管理、Agent的数据调度和Agent的信息分析共同作用。现在蒙牛营销的投放响应率比人工方式提高了12% 。


对蒙牛大模型落地经验进行了总结:只有合适的AI底座。 AI部件可以部署 企业独特的知识/流程定制,企业可以实现端到端流程的优化提效。


过去,ISV(独立软件开发商)提供满足客户实际需求的不同领域的通用解决方案。然而,基于业务场景理解、知识梳理、知识增强、知识分发和应用,ISV很少掌握公司情景知识,这在市场上留下了许多空白。


许多制造商开始响应客户的需求,并提供模型部署的底层工程能力。但由于不熟悉需求场景,产品无法满足公司的实际需求,“实用性很少”。


目前国内模型落地服务生态还不成熟,大模型落地取决于公司R&D团队的整体规划和开发能力。这无形中提高了大模型的落地门槛,使得基于通用大模型的更多创新应用领域难以开发。


行业,场景模型还没有完善


落地服务提供商的空缺导致通用大模型的能力无法在需求场景中得到充分释放。然而,在一般大模型能力覆盖不良的行业和垂直场景中,更适合的模型也处于缺席状态。


目前各大厂商商业化的主力军都是通用大模型。它知识面广但深度不足,在行业内实用性不足。相比之下,行业和场景模型都是专业人士,深入挖掘具体的场景需求,可以提供更多的商业价值。


一方面,建筑、化工、医疗卫生等专业壁垒较高的行业尤其需要行业模式。以建筑行业为例,项目一般规模较大,涉及设计、施工、管理等多个阶段,需要处理大量数据和信息。但是建筑行业有独特的专业知识和规范标准,相关数据和信息的处理需要模型来理解和应用专业知识,一般大模型一般很难满足建筑专业项目的需求。


从去年下半年开始,许多制造商都推出了行业模式。但是,业界的共识是,这类行业的大型模型能力极为有限。


许多工业企业的首席信息官认为,模型制造商提供工业模型本身是一个谬论。模型制造商培训大模型的数据一般来自互联网公开数据、采购的外部数据和企业自己的数据。这些信息主要是通用的,很难包括具体的行业。行业数据主要掌握在行业龙头企业手中。然而,大多数工业企业没有模型制造商的R&D实力,很难脱离主要业务开发行业的大模型。


对此,模型制造商的主流做法是与行业龙头公司一起开发行业大模型。但是模型制造商不能把企业的数据作为自己的,很难解决行业信息来源的问题。


一种观点认为,行业龙头公司在部署大型私有化模型后,可以将相关经验输出为行业解决方案。另一种观点认为,细分领域的科技公司也有机会成为行业大模型的推动者。但消费、供应链、餐饮行业多家龙头企业的数字化负责人表示,目前行业内还没有看到完善的私有化模式。


由于缺少行业模型,大型模型的准确性不够,与行业核心业务的适应性较低。一家代理公司的负责人告诉我们,到目前为止,他已经向能源、金融和电信行业的4-5家企业推广了太多的模型。起初,这些企业感兴趣,其中两家进入了POC。(Proof of 缩写Concepts意味着“概念验证”。这是一个用来验证某个概念有效性和适用性的解决方案)阶段,但是最后一个并没有买单。


核心原因是大型模型精度不足,最高只能达到70%左右。企业级应用对大型模型的精度要求越高越好,精度达到95%是门槛。目前,中国主要模型制造商的解决方案是提高底层模型的能力,提高大型模型应用的准确性。


另一方面,具体场景模型的缺失也阻碍了大模型的落地。肆拾玖坊正在探索包装设计图片模型落地的葡萄酒。他们尝试了几个开合源的图片模型,但是没有找到可以直接使用的产品。


张鹏解释说,包装设计不同于其他平面设计,印刷需要10M以上分辨率的照片;公司产品的核心受众是国内中年男性,包装设计要符合他们的审美;包装设计还应包含商标文本信息。


目前市面上生图模型产生的照片精度不符合印刷要求;照片风格以二次元为主,即使模型微调后,也很难生成符合酱酒设计的令人满意的中式和新中式风格;在图片上精确生成文字模型也是有限的。


理论上,服务商可以通过对图片模型进行再培训和工程开发,打造包装设计的大模型应用。然而,张鹏接触的几家服务提供商对此并不感兴趣。因为这意味着R&D投资几十万元,商业转型周期更长。


大多数服务提供商只希望销售通用大模型技术,并将销售算率、云等现成配套设施捆绑起来。 商标没有能力训练模型来处理行业问题。这样就造成了大量的需求服务空缺。


大型人才,既贵又少,


一个事实是,目前能落地大模型技术的公司很少。由于数字化基础薄弱,大多数企业缺乏对大模型技术的人才和认知积累。


一家来自世界各地顶级饮料的国内代理商的数字化负责人告诉我们,他的公司从今年1月开始通过各种渠道发布招聘信息,希望找到一个有咨询背景的大型技术人才来推动技术落地。5月下旬,这个人还是找不到,他部门提供的技术解决方案是传统的决策AI。


如果传统产业不能从内部培养或从外部引进AI人才,就很难跨越对新技术的认知差距。


对于工业企业来说,从外部引进大型人才是非常困难的,因为它需要与科技市场竞争。根据2023年11月高聘人才智库发布的《2023人工智能人才洞察》,互联网、新生活服务、游戏等公司对人工智能人才的需求最大。2023年前八个月,人工智能兴新岗位的平均工资为46518元,比2022年高6.16%。


其中,数据挖掘、算法研究员、算法工程师平均月薪超过5.1万元,年薪(不含年终奖)超过61万元。相比之下,2023年,国家统计局宣布IT岗位平均年薪仅为15.6万元,为全国生产生活服务(城市私营部门信息传输、软件和信息技术服务业)。


人工智能人才可以带来技术认知和储备。愿意招聘人工智能人才和已经有人工智能人才储备的公司,更容易落地大模型。由于人工智能人才的高投入,公司决策者对引进人工智能人才和落地大模型的态度将起到关键作用。


杨炫之指出,过去从数字化建设中受益的决策者更愿意投资新技术。否则,即使专业技术人员告诉他们大模型的价值,决策者也无法理解和相信。 当新技术出现时,只有见过、用过、感受过技术效益的人才愿意投资。


蒙牛和海底捞的大模式之所以落地“快”,是因为公司的决策者已经尝到了数字化的好处。2016年以来,海底捞加大了对数字化转型的投入。根据公司财务报告,2018年海底捞发行收入的20%(约14.6亿港元)将用于“开发和使用新技术”。自2018年以来,这笔资金每年消耗数亿港元。


杨炫提到,海底捞的企业文化和组织结构支持R&D团队在多个需求场景中实验大模型。同时,海底捞所在的餐饮业已经发展了几千年,具有很强的行业通用特性,适合目前的大模型落地。海底捞作为行业龙头公司,可以获得模型厂商的个人服务,解决大模型落地工程化问题。


但是,像蒙牛、海底捞这样的公司,在过去几年里投资了创新技术,受益匪浅。根据国际管理咨询和信息技术服务公司埃森哲发布的《2023年中国企业数字化转型指数》,受宏观环境影响,中国企业专注于运营和成本优化,创新力度明显减弱。2023年,创新活跃的企业比例下降到9%,约比2022年下降一半。在过去的六年里,参与数字业务创新的被调公司占总数的17%。



好消息是,公司对大型模型技术的认识不是一成不变的。它与大型模型应用的商业价值、标杆案例和产业模型的实施密切相关。


医药流通行业龙头企业副总经理告诉我们,即使是尚未建立AI团队的公司,也可能会受到相关利好因素的影响,迅速采用大模型技术获取利润。尤其是传统行业的龙头公司,有后发优势。当大模型显示行业价值时,他们可以通过投资并购获得相关能力。


自2023年以来,AI模型已经成为科技行业的新引擎,吸引了大量资金,催生了许多独角兽企业。然而,大模型是暂时的泡沫还是具有实质性商业价值的工具,这一问题一直萦绕在许多企业决策者的脑海中。多位接受采访的CIO表示,今年是一些行业探索大模型的第一年。大模型的价值将在实施中得到回应。


本文来自微信微信官方账号“财经杂志”(ID:i-caijing),作者:徐文璞,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com