让鲁迅说绕口令,赫本玩嘻哈,又一个视频模型火了,斯坦福华人博士成立。

06-18 09:17

AI 录像领域卷疯了。


Luma 这场狂欢还没有结束,AI 另一个挑战者来到了视频圈。——


由斯坦福大学团队生产的 Proteus。


据介绍,Proteus 这是一个低延迟的基本模型,能够产生高度真实而富有感染力的人物形象。


例如,让世界名画中的主角——蒙娜丽莎或一个戴着珍珠耳环的女孩——肆无忌惮地笑,面部情绪自然流畅:


让奥黛丽 · 赫本一改往日淑女形象,玩嘻哈说唱:


还让《哈利 · 斯内普教授在波特里唱歌《Despacito》:


Proteus 刚刚发布,一群大佬发来了。「贺信」:


AI 科学家贾扬清称赞,即时人工智能头像质量非常好。


英伟达科学家 Jim Fan 也就是说,这个项目令人印象深刻。


初期投资者 Brian Zhan 发表文件说,现在 AI 比如视频工具 Runway 和 Pika,最大的问题是会产生幻觉,尤其是在生成包含人类的视频时。而且 Apparate Labs 处理时间连接和对象恒定等问题, AI 录像生成进入下一阶段。


离谱!鲁迅谈到了绕口令


Proteus 它是人类实时表情生成的新一代基本模型。


要知道,即使是目前最先进、最强大的生成模式,也无法完全实现人类表情的实时生成。


目前模型运行缓慢,无法直观控制生成人物复杂的面部情绪和身体动作,在逼真性和感染力方面仍有所欠缺。


而 Proteus 使用最先进的 transformer 随着架构和算法的不断优化,架构的潜在扩散模式,其突破性的潜在空间设计保证了即时高效,Proteus 每秒都能实现 100 帧以上(100 FPS)的视频流。


也就是说,只需要一张简单的照片,Proteus 不但能模仿人类的笑声、说唱、唱歌、眨眼、微笑和对话,还能执行更生动的表情和动作。


比方说,一向认真的鲁迅谈到了绕口令:


或让居里夫人清唱《Le Festin》:


或者给科学家开一个圆桌会议:


据 Proteus R&D部门介绍,他们期望 Proteus 它可以成为声音可控的视觉化身,为人工智能对话实体提供直观的交互界面,同时可以无缝适应多种模式的大语言模型,为各种使用场景提供定制服务。


对于这一点,很多网友脑洞大开。——


「只要用爱因斯坦的数据微调大语言模型,再加上他生动的面部情绪,伟大的爱因斯坦就可以成为教学助手,亲自教物理课。从现在开始,青少年不用担心学不好科学。」


也有网友表示,我爱死它,今年无疑是真的。 AI 视频之时。


团队背后的底部


这个模型被大佬力捧,小而美, 后面是一个怎样的团队?


根据官网的说法,这是斯坦福大学的。 Apparate Labs 开发出来的。


现在这个团队只有 6 人类,从名字和照片来看, 3 人为华人。


沈博魁,CEO兼创始人(William Shen)斯坦福大学计算机科学系博士学位,由著名教授授学。 Silvio Savarese 和 Leonidas J. Guibas 共同指导。


他的研究包括计算机视觉、机器人学、图形学、生成模型和具体智能在内的许多领域。他的论文获得了许多奖项,例如 IEEE-CVPR 获得最佳论文奖,仍然是 RSS 最佳学生论文奖入围决赛。


在此之前,他还以为 GPA4.0 获得斯坦福大学计算机科学学士学位的优异成绩。


首席技术官兼创始人 Connor Lin 同时也是学霸。


在卡内基读书的本硕 · 梅隆大学,师从 Keenan Crane 教授。2020 几年前到斯坦福大学攻读计算机博士学位。现在他是一名四年级的博士生,由 Leonidas Guibas 和 Gordon Wetzstein 两位教授共同指导。


Connor Lin 研究重点是 3D 用于先验知识和神经表示, 3D 重建、生成和编辑,获得了 David Cheriton 支持斯坦福研究生奖学金。


攻读博士学位期间,他在谷歌学习,英伟达学习。 Adobe 在此之前,谷歌还是一名软件工程师,负责 Pixel 开发手机人像模式。


另外,这个小哥哥兴趣广泛,喜欢旅游和运动,喜欢烹饪、网球、游泳、桌游和音乐,或者泰勒。 · 斯威夫特的铁杆球迷


和 Connor Lin 同样,首席科学家 Linqi ( Alex ) Zhou 又是斯坦福大学的博士生,由 Stefano Ermon 教授指导。


此前,Linqi Zhou 由加州大学洛杉矶分校获计算机科学与应用数学学士学位, Song-Chun Zhu 教授和 Ying-Nian Wu 教授指导。


在计算机视觉和机器学习领域,他主要研究它,并致力于构建一个能以结构化、概率化的方式理解世界模型。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com