震撼2024 WAIC现场:热情、焦虑和理性都在大模型中。

07-10 08:23

世博会展厅里人们的热情,似乎与世博会中心参加论坛的人们的情绪并不成正比。


展厅里人们看到的大模型加速落地,既是表象,也是结果;论坛中的企业家和人工智能学者更关注大模型的未来发展趋势和商业化进程,以及人工智能的安全问题。热情、焦虑和理性似乎都在关于人工智能。



在今年的世界人工智能大会期间,雨季上海开始了异常高温。然而,对于连续两年登上WAIC主题词榜首的“大模型”来说,展厅内游客的热情与论坛内专家学者的焦虑形成了鲜明的对比。可以说,“外行人加入乐趣,专家看门道。”


所以,这个既令人兴奋又令人焦虑的大模型,现在究竟走到了哪一步?


与去年大模型的“重在参与”不同,今年的亮点集中在更实际的应用、更颠覆的技术和更普遍的模型上。从百度、阿里、腾讯、JD.COM、商汤,到智谱、面墙、百川、Minimax,再到三大运营商,从参数到技术,从多模式到端云协同,从价格到应用落地,每个家庭似乎都在模型的方向上更加清晰务实。


“其实我们内部对大模型技术、产品、应用还是挺冷静的”,“大模型价格战一定不是长久之计”,“今年我们明显感觉到企业内部希望通过大模型解决一些内部业务问题”,这些言论都来自于云厂商和大模型公司在WAIC会议上的高层讲话。


而且通过这次WAIC大会,一个更清晰的行业信号就是,虽然技术还不成熟,焦虑依然存在,迫切需要解决更多的AI安全问题,但AI应用确实发生在行业侧。


下面是WAI的产业家。 现场C大会实录:


云厂商谈大模型:环城河已经初具雏形


“通义灵码”阿里云、蚂蚁集团 “支付宝智能助理”、以上被选为“商汤Vimi可控人物视频生成大模型,以及智谱底座大模型GLM-4”WAIC 2024年八大镇馆之宝的四款产品,可能是看到大模型发展的最佳窗口。总的来说,它们代表了国际领先模型的前沿技术,以及渗透到日常生活中的应用。


但从B端来看,上述产品只呈现冰山一角,全景AI产业视图由云厂商、大模型企业和三大运营商的不同产品和模型组成。对此,这些公司可以算是模型布局的专业化。如果说2023年是大模型“重在参与”的一年,那么2024年可谓是“杰出”的一年。现在看来,它们各自的环城河已经初具规模。


通过这次世界人工智能大会,大模型可以主要分为六类,即大模型、小模型、垂直领域模型、多模式模型、开源模型和部署在端侧的AI。 PC。


首先,毫无疑问,几家云厂商一直牢牢占据着大模型的主阵地。不管从过去拼参数来看,“一家比一家强”;或者最后基于大模型重构自己的底座,颠覆公司的发展模式,从PaaS到MaaS;或者基于自己的垂直领域know-how,现在已经积累了几十万的客户;即使随着用户规模的增加,价格也越来越普遍;这是云厂商在模型主阵地的有力证明。


在今年的WAIC上,如果从公司各自的展位占地面积来看,华为、阿里、百度、腾讯确实是整个展厅占地面积最大的四大厂商(没有特别的顺序)。


展位图2024WAIC大会


但是,如果从各种强调的重点来看,你会发现即使是云厂商,在模型上的努力也是不一样的。比如在WAIC大会的分论坛上,阿里云在开幕式上公布了一份成绩单,即通义千问开源模型的下载量翻了一番,突破2000万次,阿里云百炼服务的客户数量从9万增长到23万,增长了150%以上。



事实上,在两年前的世界人工智能大会上,阿里云公布了通义模型开源的概念。去年8月,通义参加了开源团队。目前,阿里巴巴云开源的Qwen2一直受到开源社区的好评。


HuggingFace联合创始人兼CEO “Qwen2是王者,中国在全球开源大模型领域处于领先地位,”Clem发表了一篇文章。



此外,提到大模型领域的开源,腾讯首次在本次WAIC大会的分论坛上宣布开源世界上最大的甲骨文多模态数据集,包括1万块甲骨文的扩片和复制品,有助于加快甲骨文研究的数字化和智能化。事实上,在模型飙升了两年的今天,更成熟的技术和更繁荣的生态可以说是对大模型价值的认可。



在这个人文价值大于商业价值的“甲骨文多模态数据集”的背后,腾讯云在积累AI底层技术的同时,尤其是在音视频算法技术方面。对腾讯来说,多模态模型可以说是本次WAIC大会区别于其它大模型的一大亮点。


腾讯为什么能在多模式上处于领先水平?事实上,在过去的一年里,腾讯在AI的加持下,将积累的音视频底层技术输送到了腾讯内部的许多产品,其中最具代表性的是腾讯会议,该会议在大模型时代不断实现技术突破。


除了上述从开源生态到多模态模式的发展,本次WAIC大会更重要的主题词之一是“新生产力”。从行业的角度来看,这意味着,以大模型为抓手,加快产业侧落地,成为真正帮助各行各业的“新生产力”。而且这次也是这样 在WAIC会议上,百度智能云是分论坛的一大焦点。



从教育、人事、公司服务、娱乐、医疗等领域,百度智能云现在基于5个行业和20多个场景有了更规范的解决方案。在这些标准化的解决方案背后,正是行业know沉淀在无数客户身上。-how。对于这一点,百度智能云在现场披露了一个数据,即到目前为止,百度智能云千帆的客户已超过15万。


另外,现场更重要的消息是文心大模型的再次降价。其中,文心模型系列ERNIE 4.0 Turbo全面向企业客户开放,输入输出价格各低至0.03元/千Tokens。、0.06元/千Tokens。



此外,说到应用落地,华为盘古模型是中国众多大型模型中不可避免的存在之一。从气候模型到矿山模型,再到华为在政务、铁路、金融、制造、汽车等领域积累的垂直行业模型,可以说是行业内难以撼动的存在。


可说,如今,在云厂商内部,已有越来越多的企业参与建设垂直领域的模型团队。 中。与其同 同时,它也预示着千行百业大模型的加速落地。


AI公司谈大模型:从C到B,再从B到C,


对于走在AI前沿的世界人工智能来说, 总的来说,频繁更换的主题词也意味着每年都有新的面孔。然而,在大模型成为焦点的今年,新面孔是一家专注于大模型轨道的AI公司。在过去的一年里,这些公司不仅吸引了资本的关注,也成为了云厂商的“军械库”。因此,他们还有另一个名字“明星AI公司”。


但是,与云厂商不同,大型企业有自己的特定基因。而且这也注定了,它们和云厂商有两条完全不同的路线。


在WAIC大会上,我们观察到,以智谱、面壁、百川、MiniMax为首的大型公司,各有千秋。比如被选为“镇馆之宝”智谱AI底座GLM-4,也被称为“中国版OpenAI”。


另外,面壁智能是大型企业中主要推动端侧模型的存在。在本次WAIC大会的阿里云分论坛上,它宣布了最新的模型“小钢炮”,即MiniCPM-S,在MiniCPM上,这是最后一个“小钢炮”的再缩小版,参数仅为1.2。B,但是性能更强。对于这一点,面壁智能还特别提出了“面壁定律”,即通过更高的知识密度,实现更有效的模型。



另外两家AI企业,Minimax和百川智能,分别展示了自己的多模式模型,以及包括开源和闭源在内的大模型全家桶。总的来说,与云厂商提供的大模型相比,大模型公司的模型参数并不大,但效率甚至不逊色于OpenAI,国际顶级AI企业。


同时,随着大型模型逐渐落地,侧重点也从参数转变为更具实际意义的端侧。


对此,在WAIC展厅,产业家观察到,不仅是一家专注于终端模型的大型模型公司,一些云制造商和数字服务提供商也专注于AIC。 PC的应用落地了,比如星环科技在展厅展示的AI领域,比如财经、法律等领域。 PC,此外,联想还发布了数十款AI车型,阿里云为教育行业打造的无影云AI助手, PC,联想AI就是其中之一 PC中的“天禧”个人大模型是基于通用大模型,如阿里通义千问。



但是,在这些焦点不同的背后,一个问题是,为什么大型企业的方向是端边,是AI? PC,是小模型?


如果从企业内部基因出发,大模型公司成立时间不长,但由于其创始团队来自人工智能领域的前沿学者、专家和互联网公司的高管等。,这也意味着其大模型的效率可以更强,技术本身也不逊色于云厂商的大模型。


但是,由于大型企业与云厂商不同,在过去的云计算时代和网络时代,服务于tob企业的行业know-how等经验,同时也注定了大型企业的命运,即在与云厂商联合的同时,也要想办法“弯道超越”,找到自己的创新。


事实上,大型模型公司在B端应用中也有自己的优势。比如以端侧模型为发力点的面墙智能,最近为深圳市中级人民法院打造了国内首个司法审判垂直模式;例如,在WAIC现场,智谱AI还提供了一个典型的案例,包括公共事务、消费、文化旅游和医疗。


那大型企业未来的想象力又在哪里?


现在的大型模型可以说已经从AIGC类的C端应用,发展成为B端为行业打造的垂直大型模型,并提供解决方案,未来,对于大型企业来说,他们的想象力正是如何通过B端积累的行业know。-how,建立C端AI应用程序,从而真正繁荣大模型生态。而且这也是大型企业在这条赛道上可以实现弯道超车的机会之一。


有些人说,现在的大模型都是自嗨,因为还没有“Killer App“出现,每个人都在等待一个能够真正点燃国内大模型的killer app。对于这一点,无论是大型企业,还是云厂商,都在提到通过开源缩短差距,或通过降价来繁荣大型生态。但是,大型企业和云厂商虽然立场不同,策略也不同,但为了共同国内大型企业的生态,却并肩而立。


离世博展览馆不远的茶馆,面壁智能CEO李大海在一个轻松舒适的环境中,向媒体讲述了自己的心路历程,这是一个很大的终端模型。在这个过程中,他提到了“数据飞轮”。也就是说,产品迭代是通过服务B端客户沉淀的数据继续进行的。这也是大型企业从C到B,再从B到C的想象。


加速落地的背后,焦虑依然存在。


从国央企 AI,到工业、银行、医疗等领域, AI,“WAIC大会期间,”AI “应用”展区也成为一种新的景观。


从数字服务提供商到寻找AI解决方案公司,参观展览的人听到最多的问题是“什么是RAG”。“如果我们能用大模型处理我们企业的问题吗?”似乎每个人都能找到自己想要的答案。


但是,世博展馆里人们的热情,似乎和世博中心里参加论坛的人们的情绪并不成正比。


现在模型加速落地,也不乏焦虑的情绪。可以说,展厅里人们看到的大模型加速着陆既是表象,也是结果;论坛中的企业家和人工智能学者更关注大模型的未来发展趋势和商业化进程,以及人工智能安全问题。


事实上,在谈到大模型的发展时,许多企业家和学者对大模型价格战表示担忧。其中,JD.COM探索研究院院长何晓东博士在谈到大模型的发展时,提到了对大模型价格战的看法。“大模型价格战短期内确实会繁荣生态,但长期来看肯定不是长久之计,现在的价格可能连电费都买不起”。


而且从五月到现在,云厂商对于大模型的降价从来没有停止过。在这些声音中,也不断有声音,比如云厂商对大型模型的降价究竟是由于用户数量的增加所带来的技术普惠,还是在模型时代“换汤不换药”的传统玩法。


到目前为止,这个话题还存在争议。目前主要有两个派系。一方坚信云厂商的降价确实达到了一定程度的用户数量。对此,我们可以从百度智能云和阿里巴巴云的上述客户数量中窥探一两个;但另一方认为缺失、计算率不足、能耗高等问题没有得到处理,价格战绝不是长久之计。


这两种说法的背后,代表着不同的立场。


对于云厂商来说,短期内用户规模的增加可能会承担成本,确实会达到繁荣生态的效果;对于规模不大的AI模型企业来说,需要通过小参数模型获得自身优势。从这个角度来看,降价不是最好的解决方案。


在本次WAIC大会期间,超过20名人工智能专家学者访问了WAIC。然而,在各大网站的圆桌环节,专家们从大模型的落地现状提到了未来的趋势,从数字人士提到了智能化,从AI安全到基础学科的重要性,仿佛所有关于AI的话题都在焦虑。


除了论坛,还有外国学者在电梯间对API进行评估。 for Science的热情讨论包括滴滴司机对自动驾驶可能导致失业的担忧,以及公司和服务提供商对大模型的理性,以及所有关于AI的热情、焦虑和理性。


本文来源于微信微信官方账号“产业家”(ID:chanyejiawang),作者:思杭,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com