大模型实用,不过是三支舞
如今,全球数百个AI模型摆在我们面前的,是一个共同的问题:如何赚钱。
无论模型起源于中国还是美国,无论是通用大模型还是垂直大模型,商业化都可以算是这项技术在全球范围内共同面临的问题。
在模型最初引起的震惊和欢乐之后,大量AIGC平台走向免费开放,大型toB服务大打价格战。各种大模型似乎无法激活用户的付费欲望。
而且众所周知,商业化的前提是实用。虽然大型模型带来的AIGC能力本身就有很强的实用性,但是对于一个软件应用来说,它也是太粗糙了,太黑了。顾客需要自己去探索AIGC到底能带来什么,概率是什么,然后很难得到一定的商品满足。另外,大型模型在技术上的潜力也没有得到深入挖掘。有些需要放大产品设计的基本能力,还静静地躺在平台那一长串功能介绍里。
因此,在全球共享商业化的压力下,大模型的实用性开始加速。无论是中国还是美国,传统科技巨头还是新型AI企业都开始在模型实用性上下功夫,推出了各种大模型实用化策略。
这种情况让很多朋友有点困惑。环顾四周,感觉每个厂商都在做不同的AI产品,提出全新的AI概念。但是仔细想象,似乎说不出有什么不同。
为帮助大家克服这种乱花渐欲迷人眼的“AI眩晕感”,我们盘点了当前大模型实用化的三个主要思路。
无法理解大模型实用化的许多招数并不重要。只要记住,今天的大模型,实际上是在跳三支舞。
胡旋舞通向全模态
在那些国际AI巨头眼中,AI产品大概是什么样子,这个问题已经逐渐得到回答:或许她们希望AI和真人没有太大区别。
不久前,OpenAI和谷歌不断推出新的AI产品,即GPT-4o和谷歌的Project,这是OpenAI的最新旗舰模型。 Astra。它们的共同之处在于,它们都增加了跨文本、音频和视觉的信息收集能力。换句话说,大模型正在从只听、读、写变成同时看、说。用户与大模型的互动越来越像是与真人的互动,大模型可以在200到300ms的范围内响应音频输入,与人类的交流速度大致相同。
GPT-4o之所以被称为OpenAI,是迄今为止最实用的应用,是因为它更注重与用户的互动体验,打磨了产品侧定义的响应速度、具体使用功能等细节。更重要的是,GPT-4o创造了一种新的产品模式:它比语音助手具有更多的交互形式和更广泛的功能,同时降低了使用门槛,增强了使用场景。
这种AI产品的使用体验与真人视频电话非常接近。人们很难不去想这部电影。《Her》或者《钢铁侠》中的贾维斯,虽然在使用体验上肯定不如他们,但是产品逻辑已经和科幻电影中AI的应用想象一样了。
我们有理由猜测,OpenAI在AI实用性方面的想法是设计科幻作品,但他们只是有机会把科幻变成现实。
这种“类似视频通话”的大模型产品模式,本质上是将不同的AI感知、理解和生成能力融合在一起,就像休旋舞会转得越来越快一样。随着大模型的不断发展,AI技术也越来越快,不同模式下的信息收集能力和内容生成能力都被卷入其中。
沿着这条路走下去,有理由相信接下来的主流AI产品会发生这样的变化:
类似于Sora的视频生成能力,将很快融入到主流通用模型中。使AI应用能同时听、看、读,并能生成各种内容,包括文字、代码、音频、照片、视频等。
垂直类AI模型的生存空间会越来越小,通用模型的集成能力也会逐渐提高。正如GPT-4o中的“o”Omni全能意味着。全能性,将是AI产品的主要发展方式。
3.AI的记忆力会越来越强,从而导致“全能” 定制”已经成为AI应用的主要发展思路。
虽然在现阶段,大模型往往是与搜索、绘图、语音助手等能力相结合的。但随着全模态感知和全模态理解的不断发展,全模态产生的“三全模型产品”将不再是赋能技术,而是更倾向于成为一种独立全新的产品形态。
虽然这一产品的方向还不成熟,但是角度的确定至关重要。
类似“视频通话”的AI应用可能是人类对AI最根本的想象,除了机器人管家。它的出现和发展代表了AI时代最大的海底金矿正在出现。
类别ChatGPT使用集体舞
如果大模型是一个团队,像OpenAI这样的公司在前场有所突破,那么更多的AI公司和科技公司需要在中场竞争。随着ChatGPT的普及,OpenAI开始在智能体、文生视频模型、全模态模型等领域发展,但是大量借此机会进入大模型的企业,更多的是在打磨自己的ChatGPT应用。经过长时间的内部测试,现在大量的聊天对话框模式的AIGC应用已经走向大众。这个时候问题来了,投入那么多,也终于可以向C端用户开放了,这么费力,最后怎么赚钱?
所以我们正在目睹一个非常奇怪的场景:以国内大型阵营为代表的大量AI项目都集中在ChatGPT模式的类别上。前进的文学视频等应用还没有完成研发,但是环顾四周,你会发现每个人的能力都差不多,动作也是统一的,只有概念口号是大喊大叫。
无论是AI助手、智能平台、智能对话还是智能搜索,本质上这些大型产品都类似于ChatGPT应用。从最早的文心话到通义千问、豆包、Kimi、腾讯元宝,讯飞星火,天工,市场上已充斥着太多类似的产品,大模型变成了一场真正的集体舞蹈。
所有这类产品都被囚徒困境所困扰:我想收费回收R&D成本,但我害怕收费会引起用户的不满,把客户推向竞争产品。我想通过技术能力实现多样化,但我不能得到真正有感染力的技术解决方案,所以我不得不在概念、名字和噱头上下功夫。
为摆脱这一困境,类ChatGPT应用程序也找到了一些实用的方案,我们可以做一个总结:
开始强调类GPTs模式,以智能体煽动市场升级。
俗话说,大模型 对话就是开一个游戏,真正卖票就看智能身体了。具有定制性和专业能力的智能身体被称为大型商业化的真正目的地。面对这种可能性,各厂商也开始了自己的探索,包括OpenAI,也是如此。
比如文心大模型已经正式实施了智能体能,推出了文心智能体平台;火山引擎还公布了一站式AI应用开发平台按钮。基本的AIGC对话是免费的 先进的智能体收费产品模式,是下一步大模型商业化的主要考虑因素。
使用类ChatGPT产品作为流量入口。
另外一种类似应用的实用建设思路,是大入口 小收费窗口的互联网模式,即整体商品是免费的,但一些特定的功能可能需要打开会员或使用代币。收费功能可能比较专业,看到特定的需求群体,或者新颖有趣,激发用户对早期采用者的好奇心。
这种模式的问题是,整个产品会变得越来越复杂。客户会有一种“被招数感”,就像玩免费手机游戏一样。而且整个入口生态建设也需要更清晰的交互思路,防止客户一接触大模型就面临非常复杂的交互逻辑,充满收费入口。
将类ChatGPT应用与自身优势相结合。
第三种相关产品的建设方案是将这些平台企业的其他优势项目结合起来,然后期望达到1 1>2的效果至少要把原平台的部分用户绑定到大模型应用上。比如百度强调搜索、图书馆、网盘等应用与大模型相结合,以各种方式调用文心大模型。腾讯元宝宣布将与微信官方账号创作生态相结合,成为创作助手。
这款生态矩阵游戏是互联网产品的一贯思路,但是用户能否产生与大模型应用的粘性,是一个需要长期考虑的问题。
我们应该尴尬地承认,曾经风头正劲的ChatGPT,在早期采用期过去后,已经逐渐淡出了客户热情青睐的范围。客户更喜欢看到非常生动有趣的AI应用,可以引发潮流,而不仅仅是僵硬的对话框。
ChatGPT应用真正实用的春天,可能在于打破AIGC对话聊天框架。提取它的能力,成为一种更有美感和传播力的软件产品。
归根结底,集体舞中能被记住的,很可能是那个没有按规定行动的人。
拟人化贴面舞
除了这些大模型实用化的思路之外,还有一个思路应该引起重视,那就是拟人化AI产品。
不久前,如何让ChatGPT“越狱”做一些奇怪的事情,一些网友掀起了一场与AI“恋爱”的新时尚。无论我们如何评价这些行为,我们都必须意识到,人类对AI的基本想象必须拟人化、类人化。换言之,我们应该AI有名字,有特色,和人类有共同的记忆,而非冰冷而无所不能的对话机器。
就这一思路而言,情感和情感价值是AI带来的最大价值。我们应该与他人交谈,与他人分享,与他人取得联系,但这个人可能不需要成为一个真实的人。这种需求是客观存在的,具有商业潜力。GPT-4o被指控侵权使用明星的声音等情况,其行为动机是希望AI更加拟人化,能让用户产生与真人交谈的想象力。
在下一个商业化压力越来越大的情况下,让大模型拟人,与用户一起跳贴面舞,很可能成为很多AI项目的重点选择。
例如,角色扮演模型已经在豆包的大模型中推出。AI会模仿不同人和性格的人与用户交谈,可以通过智能体设置自己的聊天角色。
有人设置聊天的关键是多轮对话的记忆。在这一点上,越来越多的大型商品强调记忆,比如文心一言强调多轮对话能力带来的身临其境的人物体验。
技术难度小,价值可能大,但容易触及法律法规和公序良俗的边缘地带。未来大模型拟人的实用空间应该会越来越受到重视。有充足的讨论和想象空间,比如数字主播、专属AI助手等可能辐射的实用方法。
目前大模型的实用性整体处于高不成低的尴尬境地。向上突破,技术差异依然明显,技术未知领域不明;横向竞争,类似的大模型产品太多,已经产生了令人窒息的挤压感;往下看,大部分互联网用户其实对大模型应用没有感觉,找不到使用和付费的重要性;超越弯道,搞一些拟人项目,很容易触及各种雷区。
在这种情况下,大模型的实用性一定要带着束缚跳舞,既要让观众看到,又要注意舞台上的荆棘。
也许在不久的将来,一个或几个像天才一样实用的想法会解决所有大模型的苦难。然而,如今,做大型商品的主旋律仍然是赔钱赚钱,让自己的脸变胖。
本文来自微信微信官方账号“脑极体”(ID:作者:风辞远,36氪经授权发布,unity007)。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com