Sora跌落神坛,GPT-5发布是救赎还是颠覆?

07-26 23:12

在如今快速的生活节奏中,短视频已经成为缓解忙碌生活压力的主要途径之一,但在追求短而快的体验过程中,“短剧”逐渐成为一种非常受欢迎的内容形式。


仅2023年,中国网络微短剧的市场规模就达到了373.9亿元,比去年同期增长了267.65%。另外,根据抖音2024年的公开数据,其微短剧的日重用户超过1亿。



近日,小米董事长兼首席执行官雷军也表示:“短剧似乎打开了一个新的世界,比爽文节奏更快,更刺激,更好看。”


但是在短剧爆红的同时,一些创作者也在这一过程中发现了AI的价值。自7月13日上线以来,国内首部AIGC原创奇幻短剧《山海奇镜》在多个视频平台迅速走红,在Aautorapper上的观看频率已超过1000万。《山海经》中描述的神话人物和奇异生物通过人工智能技术的巧妙运用,从文字转变为屏幕上的生动形象。由于其真实流畅的表现力,人们对人工智能视频制作效果的刻板印象成功打破。



此外,《三星堆:未来启示录》由博纳影业AIGMS制作中心制作,一经推出,也取得了显著的成绩和反响。博纳电影行业行政总裁蒋德富表示,博纳选择电影工业化流程,利用AI制作这部短剧,旨在利用自己完善的电影经验,提升AI短剧的技术含量,通过AI短剧跑道讲好中国故事。



可以说,AI短剧的“人气”占据了“合适的时间和地点”,完善的全生态链接为其创造了一个滋润的发展土壤,从生产设备到平台再到受众。


这些作品的成功不仅仅是技术上的突破,更是文艺创作中多模式大模式应用的缩影。它不仅展示了AI在视觉和听觉上的处理能力,还通过深入学习和自然语言理解技术,完成了对文化元素的深刻理解和创新表达。


01 期望减少,OpenAI可以用什么来拯救?


一片欣欣向荣的景象,不禁让人想起曾经的“概念神”——Sora。


作为OpenAI发布的全新生成视频模型,它在发布之初确实引起了前所未有的震惊。当OpenAI在2月份正式揭开Sora的神秘面纱时,全球互联网和社交媒体瞬间被其强大的功能所震撼,仿佛GPT-3.5发布的辉煌时刻重现。


Sora一经发布,就因其三大核心优势迅速成为科技界的焦点。能生成长达60秒的超长视频,突破过去AI视频生成模型4秒连接瓶颈,让业界和公众都为之惊叹。其次,Sora不仅支持多角度镜头,还能实现一面镜子的顺利拍摄。生成的场景可以完美展现场景中的光影关系、物理屏蔽和冲击效果,让视频内容更加生动逼真。


当时,Sora被OpenAI视为“世界模拟器”,不仅是一个视频生成模型,也是一个能够理解和模拟现实世界物理定律的智能工具。


在发布之初,人们对Sora带来的技术创新和便利感到惊讶。许多专业人士预测,Sora将成为视频制作领域的一场革命,彻底改变传统的视频制作方式。


然而,到目前为止,Sora还在准备正式上线,包括对抗性测试,并通过由各领域专家组成的红队进行了严格的测试,以识别和缓解错误信息、仇恨内容和偏见等潜在风险。


与此同时,OpenAI还允许视觉艺术家、设计师和电影制作人提前浏览Sora,以收集反馈并改进模型,特别是针对创意专业人士的需求。OpenAI正在开发一种工具,可以检查Sora产生的误导性内容,并计划将C2PA元数据包含在模型中,以提高透明度和安全性。另外,为了了解他们的担忧,确定Sora的良好用例,公司还在与世界各地的政策制定者、教育者和艺术家合作。Sora推迟了这些活动的发布。


随着时间的推移,Sora的应用并没有像预期的那样快速推广。虽然OpenAI在技术上取得了巨大的突破,但它从未将这项技术转化为实际可用的产品,并将其推向市场。


对于广大用户来说,这种对比无疑是令人失望和不安的。一方面,Sora可以快速改变视频制作的局面,降低创作门槛,让更多的人可以轻松制作出高质量的视频内容“丰满理想”;另外一面是Sora的落地过程缓慢“骨感现实”。


Sora的困境不仅仅是技术实现的延迟或不足,更深刻地反映了当前AI技术在商业化落地过程中面临的普遍挑战。从算法优化到数据处理,从客户习惯的培养到市场接受度的提高,每一步都需要精心打磨和时间的沉淀。在这个快节奏的时代,用户对即时满足的渴望与AI技术成熟曲线的不匹配,往往会导致期望与现实的巨大差距。


02 打江山易,守江山难,GPT-从技术崇拜到信任危机


Sora除了闭关修炼之外,GPT-4o mini的突然发布更是让舆论再一次发醇,有网友开玩笑说:GPT-3.5下岗了,GPT-5还会远吗?奥特曼:是的!尽管GPT-5的发布就像镜花水月,但大多数人仍然相信OpenAI的技术实力。


然而,AI领域的竞争和变化也越来越激烈。不仅越来越多的企业和研究机构参与到AI技术的研发和应用中,垂直领域也出现了许多AI产品,以更准确的定位和更个性化的服务赢得了用户的青睐。


相比之下,OpenAI在行业中的吸引力似乎有所减弱,其“统一江湖”的局面也越来越难以维持。


就像本月9日OpenAI正式暂停向华等地提供API服务一样,原本以为是新技术垄断,但适得其反,并没有在中国引起强烈反响。


面临Open AI的“断供”,这一次国内企业的反应可谓十分积极。智谱AIAI在消息曝光的第一时间、百度、阿里、腾讯等大型公司纷纷推出API服务“搬家计划”,开始通过降价、简化流程等方式吸收OpenAI。 客户API服务。


对为何选择放弃中国市场,我们不必追寻答案,但是国内大型厂商的表现已经足以证明,就市场环境和大模型部署条件而言,国产大模型并非不能作为用户的首选。


在所谓的“大模型元年”中,我们谈论的是模型的规模和能力,而技术的增长率已经开始让企业思考如何落地和商业化。最近,快手可灵、商汤Vimi等产品的集中爆发是技术落地的缩影。不断创新已经成为企业生存和发展的基石。


大型家庭认为,对于OpenAI来说,不断创新代表着不断探索人工智能的新领域,促进技术边界,创造真正能处理实际问题的产品。GPT-5的推出不应该只是对前一代产品的简单升级,而应该是一个质的飞跃,以保持OpenAI在人工智能领域的领先地位。


03 后记:多模态能否成为超越弯道的新机遇?


AI短剧的流行无疑是一个引人注目的现象,但它只是国内多模式领域发展的冰山一角。这种现象不是技术进步的独立展示,而是技术创新与本土文化紧密结合、市场需求精准捕捉、产业链协同发展的综合体现。


我们远离了AI短剧的具体现象。这种技术创新与本土文化、市场需求和产业生态的深度融合,是我国多模态人工智能领域的关键优势。多模态人工智能在创造新生产力的过程中发挥着至关重要的作用,无论是医疗卫生领域的精准诊断,教育行业的智能转型,还是智能制造和工业4.0的快速发展。


依托国内大型厂商在市场响应上的灵活性和创新性,推出符合潮流、高质量的内容产品,不仅巩固了公司在市场上的竞争优势,也为整个多模式领域的稳定发展注入了强大的动力。


多模态人工智能是大模型竞争的全新起点。它不仅将成为推动各行各业创新升级的核心驱动力,也将成为塑造世界经济新格局的重要因素。


本文来自微信微信官方账号“大模型世家”,作者:王昊达,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com