在外滩大会上,我们看到了五年后人工智能的样子。
对一些悲观主义者来说,人工智能的发展似乎越来越慢。
2022 年末,ChatGPT 发布,五天内用户注册超过百万,两个月后月活客户超过百万。 1 亿,以此为起点,几乎每一家科技大企业都卷入了这场生成式。 AI 在风暴中,几乎每一位科技创业者都在努力寻找起飞的机会,半年融资两轮,一年破估值。 10 亿美元 “黄金时代” 看起来又回来了,a16z 创始人 Marc Andreessen 2011 年提出「这个软件正在蚕食世界」(Software is eating the world),在 2023 2008年,大家谈论的话题变成了「人工智能侵蚀世界」(AI is eating the world)。
然而,等到 2024 2008年,世界似乎还是那个世界,我们的日常生活基本上没有因为人工智能而改变,应用也没有什么变化。 “iPhone 时刻” 总是只出现在各种演讲中,而非我们的手头。
大模型本身在R&D方面的能力也存在诸多问题,GPT 5.0 迟迟没有发布,这让大家疑惑 Scaling Law 由此质疑曲线是否在放缓, Transformer 结构本身的潜力;大型模型「幻觉问题」同时也一直影响着应用的落地,甚至有论文认为经过校正的语言模型必然会产生幻觉,与数据质量或算法结构本身无关 —— 换句话说,这几乎是一个无法解决的问题。
乐观主义者认为,这些只是当技术爆炸真正进入日常世界时,必然会出现的过渡期。
当技术爆发时,我们经常过于兴奋,认为未来正在加速。但是世界本身就有自己的运行规律,需要基础设施来承接,需要应用,甚至需要更多的法律、道德和伦理准备。在外滩大会上,他们可以为自己的乐观找到足够的理由。
九月初,外滩大会在上海举行,上海黄浦世博园区也成了看得见的人 AI 未来趋势最重要的窗口。有人在讨论能否缓解孤独,有人在讨论能否帮助缓解全球变暖。在展区,仍然有许多创造性的人来展示他们。 AI 构思未来。我们是对的 AI 悲观或乐观,背后隐含着我们对它的期待。

每一个问题都是 AI 继续进化的机会。在外滩会议上,我们可以看到人工智能仍在发展。在论坛的讨论中,在每个展厅,我们可以看到五年后。 AI 的样貌。
「计算军备比赛」或许不会结束, 但是,平衡成本和提高效率越来越重要
2020 年,OpenAI 提出一篇论文 Scaling law,大意是大模型的性能和模型的具体结构。 —— 深度、宽度和层数 —— 基本上没有关系,主要是计算量、模型参数和训练信息量三者的大小。
这种观点叫做 AI 领域的「摩尔定律」,也因为 OpenAI 成功已经成为许多从业者信奉的标准。在这种信念的引导下,大模型的发展正朝着大算率、大参数和大数据的方向发展。之前的 AI 开发主要是基于各种模型的优化, Scaling Law 它代表了一个新的范式:如果有足够的计算能力和数据,我们就能解决人工智能的发展问题。
这也是计算军备竞赛的开始。最近李飞飞团队发布的《人工智能指数报告》显示,最新人工智能模型的实践成本已达到历史新高。GPT-4 训练过程消耗了大约 7800 一万美元的计算资源,谷歌的 Gemini Ultra 模型训练的费用更高。 1.91 亿美金。微软也启动「星际之门」超级计算机计划,预计投资将达到 1150 亿美元,而谷歌也很快表示将在计算率方面进行更加慷慨的投资。
篝火不断燃烧。如果我们想发展一个更好的大模型,继续在技术上取得进步,那么这场军备竞赛就不可能结束。但是,如果目标是应用落地和商业闭环,落地部署的效率和成本与技术本身一样重要。因此,提高计算效率和数据质量已经成为各企业关注的焦点。

公司需要关注如何通过技术创新实现计算能力的经济实用性,以控制投资成本而不牺牲性能,而异构计算是实现这一目标的核心技术之一。
异构化计算是将不同类型和架构的计算单元,例如 CPU、GPU、DSP、ASIC、FPGA 等等,将提高计算性能和能效的技术整合到一个系统中,可以同时处理图像处理、科学计算、科学计算等各种计算任务。 AI 这使得它们特别适合现代数据中心和推理 AI 应用需求。
具有明显的异构计算优势。它可以协同各种计算单元,显著提高响应速度和系统吞吐量,特别适合大规模并行计算任务,并可以将任务分配给最合适的计算单元,从而优化能源利用效率,降低数据中心的能耗。与此同时,异构计算支持灵活的硬件配置和软件编程,可根据需要轻松扩展系统能力,开发者也可根据算法要求选择最适合的硬件平台。
未来五年,异构计算需要逐步解决现有问题,才能走向普及。异构计算要求开发人员具备跨平台编程和优化技能,缺乏统一的编程框架和标准,增强开发难度,限制开发效率。另外,虽然从长远来看成本较低,但与目前完善的方案相比,初期硬件投资和R&D成本仍然很高,需要大企业率先投资,促进应用。
与大模型相比,小模型更容易诞生「大应用」
大约十五年前,移动互联网开始繁荣,也迎来了创业的黄金时代。相比之下,AI 时代创业更难。首先,由于成本较高,需要计算率、数据、电力等外部条件。基本上没有草根创业者能承受训练大模型所需的资金。在模型领域,很可能会发生「赢家通吃」,最终只剩下几家主要的模型制造商。
不过,AI 它是一个巨大的生态系统,在算法、计算率、数据和系统等领域都有很多机会。
在外滩会议上,数据服务提供商有很多讨论的机会。AI 大型模型的性能在很大程度上取决于训练数据的规模和质量。随着数据的增加,可以提供更多的样本,使模型能够学到更多的特点和模型。现在 AI 发展的重要瓶颈是现实世界的数据接近不足,生成数据还存在很多问题,比如物理世界的复杂性无法反映出来。
所以,一批新的数据服务提供商将成为 AI 时代的「卖水人」。这就需要以更高的效率完成包括数据清理、数据标记、数据整合和数据安全措施在内的工作,以确保数据源可靠,处理过程透明,结果可验证。高质量的数据 AI 该模型为学习提供基础,最终形成数据飞轮,促进其不断进化和优化。
应用方面有更多的创业机会,尤其是在行业领域。然而,通往行业的落地大门可能不是大模型,而是小模型。 / 端侧模型。
严格来说,「小模型」与「端侧模型」并不等同。小型通常指的是参数规模远低于参数。 GPT-3 或 Llama-13B 大语言模型,如 1.5B、3B、7B 等;「端智能」指部署在手机、电脑等客户设备上的模型。一般计算资源有限,大模型不能直接运行,新模型要特别设计。它们之间有不同的目标,但是智能终端能够顺利运行,一般都是小模型,所以有很多重叠,我们也不做细致的区别。
虽然参数小,但小模型通常致力于设计和改进某个领域和任务,在这些领域可以达到甚至超过大模型的性能,例如 Mistral-7B 在某些基准测试中,模型超过了参数较多的模型,显示了小模型在特定任务中的优势。
小模型更适合落地应用,因为计算能力和能耗低。端边,苹果在 iPhone 上使用的 DCLM 模型参数为 70 亿。傅盛还提到,公司的专用模型大约只需要100亿参数。 —— 作为对比,GPT 4 参数高达 1.7 万亿。
小模型的发展将带来端智能的普及,未来五年率先落地可能是一批。「博士」水平的专业 AI。在外滩会议上,可以看到很多潜在的商品原型,涉及医疗、能源、教育等领域。借助于这些专业化 AI 工具,企业可以更容易地将工具 AI 技术集成到业务流程中,在行业内应用。
工业侧的落地应用也有助于工业侧的应用 AI 自我进化。各领域都有大量的数据,正在使用 AI 在提高决策效率的同时,AI 还可以获得更高质量的数据,模型和算法也会不断地进化和改变,从而促进整个人工智能领域的发展和成熟。
终端智能也许是大模型的终点,但是移动智能并不一定是大模型的终点,
现在说到端侧模型,通常指的是手机,因为它是我们触手可及的最高算率设备。然而,手机可能只是端智能的过渡阶段。
智能手机的瓶颈很明显。首先,计算率不足,但更重要的是内存不足。与云服务器、手机等设备相比,内存空间和存储空间要小得多,但即使是小模型,仍然需要占用大量空间。
除了内存之外,能源和功耗问题也是个问题。AI 计算步骤功耗极大,容易造成电池电量不足,设备发热,甚至影响系统整体稳定性。
今天的解决方案一方面是改进手机配置,另一方面是设计一个小模型,以确保在有限的内存、计算率和功耗限制下高效运行。例如,苹果从 0 建立一个特殊的小模型,而不是切割现有的大模型。
但是,从长远来看,也许我们会有新的。 AI Agent,成为人工智能时代的一种新型终端形式。
我们期待的 AI Agent 不是简单的执行指令,更像是具体智能概念在人工智能领域的具体体现。它是一个智能实体,可以独立行动,感知并在环境中做出决策。
这意味着,AI Agent 它不仅可以处理虚拟任务,还可以在物理世界中执行行动,提供更丰富、更直观的使用体验。这种组合还促进了无人驾驶汽车、智能家居、工业自动化等人工智能在许多领域的创新应用。
我们与 AI Agent 交互技术也将发生新的变化。从早期的机器语言到图形用户界面(GUI)、手势控制,再到现在的全模式自然语言交互,人机交互的方式不断演变。全模式交互意味着机器可以通过多种方式(如语音、视觉、触觉等)理解和响应人类的指令。),从而促进交互更加自然直观。
随着交互技术的演变,机器不再仅仅是一个工具,而是一个能够提供陪伴、帮助和情感支持的伙伴。应用入口不再局限于传统的操作系统或应用界面,而是可以通过各种设备和场景进行交互。
也许这个不会在那里 5 一年之内就会发生,但三到五年之后,更多的人会拥有一批可以支持终端模型的手机, AI 应用程序也将全面落地,AI 也将真正跨越鸿沟,走向生活。之后,新的终端形式也将走出原始阶段,拥有初始用户,为进一步普及奠定基础。
结语
在瓦特的前半个世纪,蒸汽机的技术和相关理论已经成熟。然而,瓦特让蒸汽机终于可以在生产中使用,并将其推广到市场上。即便如此,近半个世纪以来,蒸汽机在针织厂普及,蒸汽船已经成为河运的主力军,蒸汽机才是真正的「蚕食世界」。
当今时代,技术传播和发展的时间周期已经大大缩短,但是我们仍然需要经历每一个阶段。在过去的几年里,我们见证了 AI 未来五年,技术的爆发,或许正式找到属于 AI 在针织厂和蒸汽船上。
iPhone 它诞生于美国,但中国是移动互联网最繁荣的市场之一。也许在未来五年里,我们可以看到更多 AI 应用和场景的爆发,形成了繁荣的中国 AI 应用生态。
本文来自微信微信官方账号“机器之心”(ID:作者:关注AI,36氪经授权发布,almosthuman2014)。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com



