结合谷歌计划 Gemini 与 Veo 模型,创造全能 AI 助手

04-14 09:20

IT 世家 4 月 13 日消息,谷歌 DeepMind CEO Demis Hassabis 领英创始人 Reid Hoffman 播客节目共同主持 Possible 据透露,谷歌计划将其旗下的 Gemini AI 模型与 Veo 将视频生成模型进行整合,以此提升 Gemini 了解物理世界的能力。


Hassabis “我们将从一开始就说:” Gemini 这个基本模型被打造成多模态模型,由于我们有建立一个通用数字助手的愿景,这个助手真的可以在现实世界中为您提供帮助。"


目前,整个 AI 产业正逐步向“全能”模型方向发展,这类模型可以理解和整合各种媒体形式。最新的谷歌 Gemini 模型不但能产生图像和文字,还能产生音频; OpenAI 在 ChatGPT 现在里面的默认模型也可以建立图像,包括宫崎骏其人风格的艺术作品。亚马逊还宣布计划在今年晚些时候推出一个“随意”模型。


据 IT 这些“全能”模型需要大量的训练数据,包括图像、视频、音频、文字等等。Hassabis 暗示,Veo 这些视频数据主要来自谷歌旗下。 YouTube 平台。“通过观看大量的观看,他说:” YouTube 视频,Veo 2 能理解世界的物理规律。”之前,谷歌曾经走过 TechCrunch 表示,其模型可能是基于和 YouTube 利用“部分”,创作者达成的协议 YouTube 练习内容。根据报道,该公司去年扩大了部分服务条款,以获取更多数据来训练其服务条款。 AI 模型。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com