最强卷王3个月进化9次!可灵AI新1.5模型,外国网友:太疯狂了

2024-09-23

机器之心报道


作者:杨文


直出 1080p 影视视频,加量不加价,相当良心。



传说中的 Sora 公测还没有希望,「卷王」可灵又上新了。


要知道,从今年开始 6 月亮发布以来,只有三个月,可灵 AI 就迭代了 9 次。


这一次,它还直接升级了底座模型,推出了可灵 1.5 模型。


所以,这个新模型到底强在哪里?


例如,我们输入相同的输入。 Prompt:一个女孩看到一封信后悲伤地哭了起来。


1.0 模型的效果如下:



有关配图


1.5 模型效果如下:


(视频来源:X 博主 Pierrick Chevallier)


一言以蔽之,可灵 1.5 模型不但显著提升了画质,直出。 1080p 录像,还使画面主体的动幅更大,质量更高,文字响应更强。


甚至官方也释放了「豪言」,与可灵 1.0 与1.5相比,模型 提高模型内部评价的整体效果 95%。


同时,可灵 AI 图片视频中仍然引入了全新的视频。「运动笔刷」功能性,进一步提高对视频生成的精确控制能力。



有关配图


别看可灵 AI 拿出很多宝贝,但是加量不加价,产品价格不变,一个高质量的视频还是一个高质量的视频。 35 个灵感值。


外国网民已疯狂玩耍,甚至一度将服务器挤压。



有关配图


话不多说,是骡子还是马,现在我们就拉出来散步。


可灵AI网站链接:https://klingai.kuaishou.com/


堪比电影大片的质感


此前的可灵 1.0 在高质量模式中,模型只能生成 720p 虽然视频在许多视频生成模型中表现出色,但是随着用户对视频的关注, AI 随着技术期望的不断提高,这种清晰度已经不能满足他们的高标准需求。


如今可灵 AI 新推出可灵 1.5 模型,支持高质量模式,生成 1080p 超清视频。


例如,我们输入 Prompt:一只拟人化的橘猫,戴着黑边眼镜,圆脑袋大肚子,穿着白衬衣,坐在电脑桌前,表情疲惫,想睡觉。


1.0 模型:



有关配图


1.5 模型:


尽管两者都遵循了 Prompt 需求,但从美感上讲,1.5 模型橘猫倚在椅子上眯着眼睛打盹,看起来更加憨态可掬,柔和的台灯光源洒在橘猫脸上,配色也更加自然。


还有一种科幻风格。


Prompt:超级现实,电影,宇航员开着马车在荒凉的月球上行驶,细节完美。


1.0 模型:



有关配图


1.5 模型:


在可灵 1.0 在模型中,两名宇航员乘坐的马车略显简陋,只有一匹马,两个轮子,加上一块碎布随意摆动。


而到了 1.5 模型,全副武装的宇航员坐在车箱里,马蹄上裹着金属腿,散发着蓝色的幽光。无论是构图还是氛围,都有科幻电影的感觉。


继续输入 Prompt:一只小斑马走在指尖上。


大家都知道,手指歪曲一直都是 AI 其中一个常见的问题,但在可灵 1.5 在模型中,手部细节并不明显。 bug,与此同时,还发挥想象力,展现了一位年轻女子凝视迷你斑马的画面,目光运转甚至是真实的。


再比如 Prompt:街上有个小男孩在滑板。


可灵 1.5 在模型中,小男孩从站立滑行到慢慢弯腰抓住滑板,整个动作行云流水,也更符合物理世界的运动规律。


与此同时,男孩的脸部情绪自然,丝毫没有崩溃,头发也清晰可见,对光影的处理更加到位,整个画面极具影片美感。


也有外国网友使用可灵 1.5 这个模型产生了一个女孩站在废墟中的场景。


战争过后,一片混乱。小姑娘别无选择,只能站在废墟上,皱着眉头,眼里流露出无尽的悲伤和恐惧。它的真实性和细节堪比现场拍摄。


不管动幅有多大,都不会崩溃


现在,市场上大多数 AI 生成模型都有一个问题,要么是运动幅度小,流畅度不足,要么是运动幅度太大,画面怪异。


例如,骑摩托车到天上去的大妈们:



有关截图


此次可灵 1.5 模型将动态质量提升到一个新的水平 level,可以使视频中的人物运动范围更大,动作更合理,同时也可以保持一致。


Prompt:一个短发的亚洲女孩,穿着米色宽松的毛衣,浅棕色的裤子,骑着一辆罗马假日摩托车。摩托车是蒂芙尼蓝的颜色。在罗马的街道上,阳光明媚,构图完美,画面精美,细节刻画,电影镜头。


1.0 模型:



有关截图


1.5 模型:



有关截图


1.5 在模型中,女孩握手调整方向,头发也随之飘动,整体运动范围更大,电动汽车的运行轨迹也更加合理。


Prompt:一只毛茸茸的黄色小猫正在玩一个红色的小毛线团。


1.0 模型:



有关截图


1.5 模型:


两个模型在这一轮测试中各有千秋。


1.0 模型重视的是小猫撩拨脖子上的红色毛线,构图、配色极具美感;1.5 这个模型突出了小猫抬起爪子玩线团,不管是小猫的动作还是毛线团的旋转,它的动作范围都比较大。


让我们再试一次图片视频功能。上传一张马斯克的照片,输入提示:马斯克正在吃汉堡。



有关截图


1.0 模型:



有关截图


1.5 模型:


背靠有很多吃播视频的快手,可灵灵 AI 就餐视频生成而言,算是无与伦比。这一轮 PK 其中,两个模型的形成效果不相上下。


「硅谷钢铁侠」马斯克第二次变成了美食家。他先是拿起汉堡看了一眼,然后张开嘴咬了一口。咀嚼时,他的下巴上下,脸颊有节奏地颤抖,汉堡上留下了清晰的咬痕。


最令人惊讶的是,猪八戒拿起木筷吃面条这一段:



有关截图


二哥端着碗,提着筷子,挑起一坨面,歪着头往嘴里送。不得不说,猪八戒握筷子的姿势比人类更时尚,面条的下垂感也相当细致。


再复杂的拍摄手法也可以 get 到


除画质更高,运动范围更大外,可灵 1.5 模型也可以响应更复杂的文本描述要求,甚至可以「胡编乱造」。


例如,我们上传了一张没有人物的牛肉面的照片,然后再配上。 Prompt:镜头拉远了,一个小姑娘拿着木筷子开始吃饭。



有关截图


可灵 1.5 在模型生成的视频中,随着镜头慢慢拉远,一双筷子进入画面,然后出现了一个小女孩,手里拿着筷子,拉着面条。


但在 1.0 在模型中,对提示词的认识稍有欠缺,画面中没有人物,只是出现了一双筷子,慢慢地拿起碗中的牛肉。


有关截图


同时,我们还输入了一个像短文一样的文本描述,包括许多情景细节,以及对镜头景深的需求。


Prompt:一只斑点狗在浓密的花园里快乐地走着,仿佛在追逐一些东西。它向前小跑,眼睛睁得大大的,充满了快乐。在行走的过程中,它仔细地看着树枝、鲜花和树叶。小路很窄,斑点狗不得不穿梭在植物之间。图片是从路面的角度拍摄的,跟随斑点狗的脚步,提供了一个低矮而亲密的角度。颗粒感明显,给人一种电影般的视觉效果。散落在树叶和植物上方的阳光营造出温暖的对比效果,突出斑点狗的毛发。画面清晰锐利,景深较浅。


可灵 1.5 模型生成效果如下:



有关截图


不仅对输入指令有了准确的理解,而且产生了与之匹配的视频内容,画面的整体构图和光影表现也使得视频极具艺术性和观赏性。


另一种拍摄手法更加复杂。 Prompt:灯塔周围的超快无人机视角,悬崖,戏剧性,pov 镜头,电影。


1.0 模型:



有关截图


1.5 模型:



有关配图


「pov 镜头」、「超级快速无人机视角」等待镜头描述,无疑增加了。 AI 很难理解,但是两个模型都给出了超出预期的画面。


1.5 模型生成的场景更加稳定,镜头由远及近慢慢推动,矗立在悬崖上的灯塔也发出一道白光。


而 1.0 模型镜头转换更令人兴奋,首先是旋转式俯拍,然后近距离环绕拍摄,完全符合超快速无人机拍摄的文本描述。


一勾一画,指哪里动


图片视频时,为了大大提高创作者对运动效果的控制能力,可灵灵 AI 还带来了「运动笔刷」功能。


然而,这个功能只能是可灵的。 1.0 使用模型。


游戏性也很简单。


比如我们上传一张水母的图片,然后勾勒出照片中需要控制运动方向的部分,然后画一个示意运动方向的箭头,就可以实现精准的运动控制。



有关配图


当然,我们也可以打开它「自动检测区域」的按钮,让 AI 自动化识别,也可为某些元素指定额外的静止区域,使视频内容具有更好的运动控制和运动性能。


上效果:



有关配图


值得注意的是,目前这个功能可以在图片中找到。 6 一个元素指定运动轨迹。


例如,让三只水母在海里游向不同的方向:



有关配图


或是将一幅梵高风格的油画,各种涂抹标志。



有关配图


最终产生的视频竟然有一个 3D 效果:



有关配图


此外,可灵 AI 其他功能也在路上升级,比如可以一次产生最多。 4 条视频;「图生视频」新增功能支持 10 秒长,支持标准模式下增加尾帧;「AI 照片」对画质提升等支持。


可灵 AI 这些新功能一经推出,就吸引了全世界的网民前来「尝鲜」。很多网友在体验之后表示,这是迄今为止最好的视频生成模式,可以与专业电影制作相媲美。





有关截图


自今年 6 月份首次亮相至今,可灵 AI 已经进行了 9 迭代升级,至今已超越服务。 260 产生万用户 5300 万张图片和 2700 一万个视频,深受包括国内著名导演在内的创作者的青睐。


为进一步探索 AI 快手还特别启动了电影制作中的潜力「可灵 AI」导演同创计划。该计划汇集了李少红、贾樟柯、叶锦添等。 9 一位杰出的导演,他们将使用可灵 AI 技术,创造 9 部 AIGC 影片短片,这不仅是技术与艺术的融合,也是对未来影片制作模式的大胆尝试。


由此可见,AI 重塑电影产业不再是一个遥远的预言,而是一个正在发生的现实。AI「新影像」时代正在呼啸而来。


参考链接:


可灵官网 https://klingai.kuaishou.com/


https://x.com/CharaspowerAI/status/1836519202112573940


本文来自微信微信官方账号“机器之心”(ID:作者:关注AI模型,36氪经授权发布,almosthuman2014)。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com