顶级AI投资者发起中国大模型群聊:十大趋势、智能化、AI超级应用

2024-07-18

转眼间,2024年已经过去了一半,从Sora模型开始到现在,生成式AI领域产生了许多新的变数。


一些猜测相继被现实验证:国内AI视频生成模式进展迅速,手机和PC厂商掀起AI狂欢,AI新硬件昙花一现。智能计算建设浪潮将英伟达送上3亿美元的市值俱乐部,热钱不断涌向AI创业...


出现了一些国内限制的现象级事件:AI卖课首先赚到第一桶金,前后文长度卷到1000万汉字,大模型价格战疯狂开战,AI粘土特效风靡社交网络,AI Infra企业忙于打下大型模型的成本…


烧钱与赚钱,动力与陷阱,技术突破与应用变革…围绕这些AI发展必不可少的衡量选择,最早投资和布局最丰富的中国AI领域投资机构存了一个局,把它存起来十多个中国通用大模型,多模态大模型,AI Infra、具有智能化、生成式AI应用的活跃企业家聚集在一起,聚焦于他们的思考和洞察。


一切都在被AI改造,没有什么能阻止Scaling。 Law的脚步,但对AGI的长期信念还不足以掩盖目前实际的商业化困境,行业还在等待一个真正属于大模型时代的超级应用的出现。


信息干货如下:


01.生成式AI应用落地需要解决三大问题,多模态应用创业企业比例上升


自2013年以来,启明风险投资系统布局了AI领域,投资超过60亿元或等价美元的项目超过50个,其中近20家在二级市场上市或成长为独角兽企业。其投资企业中,中国大语言模型、多模式模型或具有智能模型R&D领域的龙头企业有10家,数量居全国第一。



重点关注AI领域的方向。


对于启明创投主管合伙人周志峰来说,生成式AI应用的落地仍然需要解决三个问题:


1、降低模型维护成本。未来一两年,生成式AI的成本还有很大的下降空间,降至1/1000是一个大概率事件。成本越低,AI技术就越容易落地。


2、提高大模型的效果。大模型幻觉问题难以避免,另外两个效果问题也很重要:一是客户在向某个语言模型和产品提出误导性问题后,如何回答模型;第二,具体场景下使用大模型产生的答案或内容是否正确合适。


3、提高用户留存率。第一波生成AI应用的留存率相对较低,无法与互联网头部应用相比。无论是Save,如何让每个人真正把生成的AI产品变成生活或工作的一部分 无论是Killlle还是Kill? Time,这是下一步发展的一个重要问题。


根据启明风险投资的统计分析,生成式AI正处于三个“C领域”——Copilot(生产力工具)、Creativity(创意)、Companionship(陪伴)赢得了大量用户的青睐,正面临着提高效率的问题(Save Time)类应用程序获得快乐(Kill Time)类似应用程序的变化。这类似于当年互联网应用的发展轨迹。


去年,启明风险投资整理了当前发展阶段生成的AI产业脉络,这种三层结构至今没有太大变化。今天,我们仍然可以继续沿着这个脉络投资。


据启明创投去年对200多家中国生成型AI公司进行了深入交流,那时候公司主要是生产力工具,46%的公司都在做Savee。 Time类应用


这也符合技术发展的趋势。当技术不够成熟时,一些开发工具将首先诞生,供专业用户使用。其他领域包括Chatbot、智能助手、娱乐应用等。,并没有占很大比例。在系统结构方面,去年的创业企业主要是研发基础模型的企业和一些大型分布式培训平台的公司。


截至上半年,根据启明创投对400多家深度交流的AI创业企业的统计,多模式应用的比例呈上升趋势,基于AI大模型技术的新应用类别很多。同时,更多的企业深入培育某个垂直领域和场景,基础设施层的技术创业方向更加多样化。


02.2024生成式AI十大展望:多智能体技术飞跃,视频生成将全面爆发


2024年,周志峰认为生成式AI的技术基础仍在快速发展,视觉语言模型,MoE、Agent、RAG和其他技术方向正在迅速发展。启明风险投资现在提出了新的十大生成式AI展望


1、目前,GPT和扩散模型将逐步结合生成式AI的两大核心技术,激发新的模型能力;


2、优质数据的获取和组织将对新一代模型产生显著影响,预训练中生成数据的比例将大大提高;


3、多智能体(Multi-Agent)通过优化合作和分工,技术将飞跃,显著提高生成式AI的效率和质量;


4、图像和文本的统一持续表达将会出现,并且基于此的图文联合扩散模型将达到GPT-4o等级;


5、图像和视频隐藏空间表示的压缩率提高了5倍以上,从而使生成速度提高了5倍以上;


6、3年内视频生成将全面爆发,结合3D能力,可控视频生成将改变影视、动画、短片的生产模式;


7、超多模式模式模型,如文本、图像、语音、音乐、3D等,我们将见证更多模式信息的压缩。、传感器数据(控制指令、眼动信号、手势信息、雷达信号等);


8、生成AI可以打开人类语言和机器语言之间的转换通道,使机器完成复杂任务的成本显著降低,带来巨大的生产力变化;


9、由于三个因素的叠加,端侧推理将大幅增加:推理优化算法 端推理芯片 端侧大模型;


10、AI将在多个数字化水平较高的行业中占据主导地位,并对大多数企业软件进行重塑。


03.热钱投入生成AI应用


AI领域从创业和投资的角度来看,机会非常大。根据摩根士丹利的数据和启明创投科技团队的分析与评估,仅在2023年,全球一级市场在AI领域的投资就达到了224亿美元,超过了过去十年的总和。


224亿美金中,超过2/3的资金投资于从事基础设施或模型研发的公司,大约20%投资于生成式AI应用公司。周志峰预测今年和未来两三年,两者的比例将发生显著变化,越来越多的资金将投入到应用公司。


在去年的世界人工智能大会上,有三种典型的生成式AI应用:ChatGPT、Character.ai、还有Midjourney。而且今年,AI应用已经有很多种了。


在AI领域,启明创投的投资策略已经演变,从把AI作为一项技术或垂直领域进行投资,到把它作为基本能力,寻找它在千行百业落地的巨大潜力。,从今年开始,我们将重点关注7类生成AI应用:AI在垂直领域(Vertical AI),公司AI (Enterprise AI), AI交互平台,AI内容平台,AI工具,AI游戏,AI硬件


周志峰说:“从投资数量来看,我们未来80%的投资企业将成为生成AI的应用企业。


他认为,生成式AI仍处于其发展周期的初始阶段,与互联网浪潮中使用的落地时间点相比,预计当前AI浪潮中应用的爆发将显著提前。


与互联网时代不同,AI的应用不需要等待5~8年才会大规模爆发。这是因为在过去的几十年里,互联网、移动互联网、大数据、云计算等技术的快速发展为整个生态系统奠定了坚实的基础。因此AI应用将与底层技术同步发展。我们目前处于互联网90年代的基础设施建设阶段,也接近2000年的应用发展水平。


与其他领域相比,生成式AI应用企业发展时间更长,需要克服TPF(技术-商品匹配)和PMF(商品-市场匹配)两大挑战。


所以,创始团队需要更多的耐心和耐心。 理解技术(技术边际)的决心、了解商品(原生AI商品的新特性和新的分配机制)、了解世界(全球发展的机遇)。


周志峰将生成型AI企业家概括为三种典型画像:第一,AI科学家,来自研究机构或大型科技公司的AIR&D部门;第二,产业专家,对某个行业或商品、运营等有特殊了解的大师;第三,新企业家越来越多,95后甚至00后的企业家也越来越多。


在R&D还不成熟的时候,找到合适的产品形式。三类创始人都有自己明显的优缺点。目前AI科学家创始人占比约三分之一,说明技术浪潮还处于发展初期。这些人更准确地掌握了技术基础的边界,对技术发展的感知更加敏捷。周志峰认为他在在接下来的两三年里,第二类、第三类创始人的比例将继续大幅上升,并成为主流


04.AI原生应用落地遇难点,AGI开发需要多种方法结合


许多AI企业在本月发布了新产品。无问芯穹发布了世界上第一个支持单一任务千卡规模异构芯片混合训练平台;阶跃星发布了三款Step系列通用大模型新产品,全新升级了通用大模型的底座能力;无限光年发布了光语大模型,灰盒可靠,100亿参数模型优于超大型GPT-4 Turbo。


大型模型的实践和推理都需要强大的计算资源支持。对于无问芯穹创始人、CEO夏立雪来说,AI Native应用落地面临着四个关键的Infra问题:1)激活“沉睡芯片”,促进异构算率整合;2)提高各种计算卡模型的计算性能;3)为大规模训练集群提供稳定训练/打牢基础;4)更有效地利用有限的端侧计算资源。


阶跃星辰创始人,CEO姜大昕认为,“探索AGI路径,”Scaling Law”与“多模态”密切相关,缺一不可,两个方向并驾齐驱,最终达到AGI。他认为Scaling 随着参数、信息量和运算量的增加,Law仍然有效,模型性能仍然呈幂次方增长。


他相信多模式是构建世界模型的基本能力,也是通往AGI的唯一途径。,从算法的角度可以分为三个阶段:第一阶段是模拟世界;第二阶段是探索世界,将大模型与身体智能相结合;最后阶段是总结和总结物理世界的规律,发现人类还没有发现的规律。这三个阶段可以并行发展,而不是依次进行,但进化速度可能不同。


复旦大学浩清特聘教授、上海科学智能研究院院长、无限光年创始人漆远Scaling Law不会直接推动AGI的实现。AGI的目的是发现复杂世界的未知规律,而目前的大模型高度依赖数据,而未知规律可能缺乏海量数据支持。


根据他的分析,目前大模型主要与学派的“黑盒”概率预测相结合。如果符号计算与大模型相结合,可以同时具备“白盒”的慢思维逻辑能力。AGI发展的重要方向是两种方式的结合,实现“灰盒”的可靠性。深度学习可以实现数据拟合,并延伸到数据没有的地方。当知识规则与关键数据发生冲突时,可以调整知识规则,摆脱数据依赖。通过符号计算和神经网络的结合,“灰盒”可以应对大型幻觉问题和垂直领域的专业问题。


05.什么时候会出现AI超级应用?面临哪些挑战?


关于AI超级应用何时出现,周志峰分享了一句他非常喜欢的西方乐队的经典歌词:“我们只需要一点耐心。”


"超级应用的到来,不会是贝多芬的《命运交响曲》,一上来就是一种强烈的节奏,一种命运敲门的感觉。使用的孕育是渐进的,更像是梁祝。首先是微弱的鼓声,慢慢引入一个长笛,然后到小提琴后面的主题段落。他说:“今天,我们可以听到AI应用程序的微弱鼓点从远处传来,这样我们都可以保持一点耐心,期待那些优秀应用程序的出现。”


1、未来生成型AI产业有望诞生哪些超级应用?


智谱AI COO张帆认为,大模型的核心是提高人机交互的带宽,每次提高交互带宽都会重构客户的需求和应用模式。企业和开发者可以通过MaaS平台降低使用和训练模型的成本,更容易探索和构建超级应用。


在他看来,在接下来的几年里,可能会出现颠覆性的超级应用,但是这些应用往往很难提前设计,而是通过不断的迭代逐渐出现。许多不可想象的应用将在AI时代涌现。这个过程需要提高计算率、网络、硬件能力和用户习惯,并遵循从小规模应用开始逐步发展的原则。


米米AI的目的是成为AI漫画和动画平台的领导者,致力于结合AI技术和内容生产。米米AI创始人、首席执行官丁黎预测未来几年,在制图、漫画、2D动画等领域,将会出现颠覆性的超级应用。


悉之智能致力于AI教育,悉之智能创始人,CEO孙一乔预测,未来,超级应用将从需求出发,垂直解决问题。教育是一个非常有潜力的行业。教育行业频率高,需求刚度高,AI超级应用容易出现。


无限光年首席执行官朱剑雄认为,超级应用将在未来几年出现在许多领域。从PC网络时代到移动互联网,流量入口的变化提供了参考,类似的趋势在大模型时代也会出现。具有深厚场景服务能力的企业可能成长为超级应用


2、生成AI超级应用需要克服哪些挑战?


谈到挑战,丁黎感到与行业从业人员形成友好的生态系统至关重要。当前AI创业需要高资本、高技术门槛,团队需要团结协作,共同应对挑战,才能在激烈的市场竞争中脱颖而出。


朱剑雄提及产品经理的角色和要求发生了变化。现在的产品经理不仅要定义情况和需求,还要把这些信息传递到大模型,进行评估和验证。了解模型和客户的产品经理目前在市场上相对稀缺,但是随着时间的推移,这个问题将逐步得到改善。


衔远科技首席算法科学家丁宁分享了两个惯性陷阱:资源惯性和技术惯性。他还提及数据缺失问题,特别是负信号比例高的情况缺乏高质量的数据,是未来的一个关键挑战。


06.探测具体智能:方法、难点和最终结局


具体智能也是产学界共同关注的焦点,关于技术路径、落地方向、通用机器人的终极形态等问题,有许多不同的声音。


星动时代创始人陈建宇,清华大学助理教授,相信人形机器人将是通用机器人的终极形态。,不仅仅是因为双脚和双手的纯人形与当前环境的兼容性更好,更容易从人类世界中转移到实践数据的获取。机器人有望在未来的各种任务中取得最终的性能。


就技术范式而言,端到端脑小脑融合方案将是未来非常重要的研究方向。,仅用人类语言作为大脑和小脑之间的传输界面效果有限,可参照当前自动驾驶中的端到端联合训练,直接向图形大模型反馈物理数据会更好地提高整体模型效果。


在不久的将来,陈建宇提出,或许可以设计一种机器人图灵测试,一种机器人可以与人互动,其背后可能是智能自控,也可能是人类遥操作,如果技术发展到很难区分机器人的背后是人工智能还是人类遥操作,那可能就是机器人真正实现智能和通用的那一天。


上海交通大学教授、穹彻智能创始人卢策吾是世界上第一个用机器人刮胡子的人。他认为具体智能的最终结果需要综合考虑技术迭代和商业需求。具体智能作为承载硬件的软件算法,欢迎各种机器人形式


对具体的技术路径来说,具体智能算法需要两个关键因素,世界模型能够感知和理解世界。,以及技术操作模型具有强鲁棒性。


力反馈机制在使用模型中非常重要。,不仅在图像层面之外增加了一个互动层面,还减少了对世界模型ms级别决策的依赖。穹顶智能展示的削黄瓜、叠衣服等技巧都说明了在具有鲁棒性之后,操作模型可大大扩展隐性应用空间。


不久前,银河通用发布了第一代具有泛化性的大型机器人。北京大学助理教授、北京大学-银河通用联合实验室主任王鹤认为,人形机器人是未来整个通用机器人市场的最大公约数。然而,在实现这一最终目标的过程中,每一步都需要一个健康的商业模式,让机器人真正进入现场。上半身拟人底盘将是三年内最有可能实施的实际解决方案。


银河通用从技术角度特别关注。如何实现小脑技能控制模型的充分泛化和通用性?。针对小脑技能,银河通用自主研发合成了数千万的场景数据和数十亿的捕捉数据。在生成数据的实践下,银河通用机器人实现了95%以上的成功率,捕捉透明和高光随机放置的物体。


什么时候具身服务机器人才能真正进入严肃的场景,进行大规模的商业化生产?哪些挑战需要克服?


王鹤提到能落地的机器人需要足够低的成本和足够高的耐用性,这些都需要技术公司不断打磨硬件和供应链能力,而国内企业自然有优势。


卢策吾补充说,还需要快速POC。只有开箱使用,才能快速规模化。降低成本的关键是控制成本硬件和灵活组装能力。“大脑”应该足够通用,落地成本应该足够低。


陈建宇对国内发展具体智能的前景持乐观态度,感到每一家创业公司都应该思考如何利用中国市场的优势,最大限度地发挥国内供应链的优势,打造具有全球竞争力的硬件产品。


结论:AI计算新浪潮,看看中国


对周志峰来说,将边际成本降低到接近零的维度,正好是判断一项技术能否成为最大科技浪潮的关键标准。,近50年来,微控制器、因特网、人工智能是科技发展史上最大的三大浪潮。


微型控制器将计算的边际成本降低到很低的水平,因特网将分配成本降低到零,生成AI的核心是将数字内容创作的边际成本降低到几乎为零,所以AI技术似乎一定会释放出巨大的价值。


AI是第三次计算革命,中国是最好的孵化地。中国的显著优势是市场巨大,中国是孕育新一代优秀公司的最佳苗床,每次发生重大科技变革和范式转移。


根据斯坦福大学HAI研究所发布的《2024年人工智能指数报告》,中国在AI领域的专利数量在2022年占全球的61.1%,超过美国的20.9%


美国保尔森基金会Marco 全球AI人才Polo智库报告显示,从2019年的29%到2022年的47%,中国是世界顶级AI学者,是人才最丰富的地区。


中国在应用方面也有丰富的经验。在移动互联网时代,许多被广泛使用的艺术家成功应用,为中国推进新一波AI原生应用奠定了坚实的基础。


据启明创投科技投资团队统计,自2010年以来成立以来,每月活跃用户超过5000万的应用程序被定义为“超级应用程序”,中国共建立了30多个团队或单位。相比之下,共建立了7个美国团队或单位。


“许多科技巨头已经在互联网和移动互联网中孕育出来,这种现象必将在生成式AI时代再现。我相信中国新一代伟大的科技公司已经形成。”周志峰说。


本文来自微信微信官方账号的“智东西”(ID:zhidxcom),作者:ZeR0,编辑:漠影,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com