设计者看呆了，印象派插画转视频，揭示了Luma隐藏的玩法。

2024-06-19

刚刚玩过Pika 2.0这个“最好的免费AI视频生成工具”之后，网友们又有了新的乐趣。

昨天晚上，我在微博上看到了设计师@Simon_阿文 Po制作了一组AI制作的照片。本来他想让这个名字“难堪”Dream Machine”大模型，但是…小丑张嘴说话，旋转木马开始旋转，独角兽开始飞奔，po主大叫“我疯了”。

▲静帧生成“马戏团”视频(来源：Simon_阿文）

我也很惊讶，这绝对是迄今为止的第一个。可以将风格化图片转化为合理的视频模型。。(风格化是一种模拟真实艺术手法的创作方法，具有绘画或印象派的作用，不注重写实。)

Dream MachineLuma(造梦机)是2021年成立的。昨天AI免费开放的视频生成了一个大模型，这家公司在A轮B轮中都获得了英伟达的投资。Luma 120帧图像(5秒视频)可在120秒内生成AI模型。

就官网效果视频而言，“人闭上眼睛，在水下呼吸”、"北极熊懒洋洋地在雪野里爬行"、“房间瞬间爆炸”…动感，真实，流畅，甚至有一些故事的延伸感！

▲Luma.官方视频效果AI

全球互联网的热情突然被点燃，大量用户涌入Luma AI网站，即使是今天早上我试用的时候，也会排队。我承认，Luma AI生成模型终于可以使用了。虽然视频帧率远不如Sora，但细节上还是有很多问题，但是比Pika半年推出的模型有了很大的进步。

01 实测：风格化感染力好，但是画质太有问题。

Luma AI造梦机的大模型使用起来很简单，只要登录官网，（https://lumalabs.ai/dream-machine）注册后，通过输入文字提示词，等待2分钟左右，即可获得5秒的视频。

我先后把一些风景照片，影视截图，Coser高清照片等等投给Luma AI，120s的时间不长。如果能忍受偶尔的卡屏，模型可以消化各种风格，拿出一些生动有趣的“电影级”画面。

第一，这个模型对于提示词的要求很低，即使你说“把图片变成视频”，Luma AI也可以自由发挥。比如我把电影《教父》的场景给模型，你能想象AI会如何“继续写作”吗？视频中，老教父站了起来，旁边的侍从一脸凝重地抓住了他。这张照片让人遐想，仿佛在暴风雨前准备出发。

▲影片《教父》生成视频

一直以来，大家对图片视频模型的印象大概是超现实还可以，但是风格化表现极差。这一次，Luma 但是AI的表现确实不同。

相对而言，文字视频的效果会更差一些。。我直接使用Luma AI给出的参考文本生成视频，可以看到视频中的熊突然跳到空地上，然后对一个不断变形的吉它使出了“无影爪”...运动范围不是很流畅。

▲文字“一只戴着墨镜的泰迪熊在美丽的瀑布前的丛林里，弹着电吉他，跳着舞，摇着头。”生成视频

我承认，Luma AI在做画面补充方面有一手，但是还是会在这一点上翻车，出现完全不符合内容逻辑的情况。。比如我把《楚门的世界》结尾的经典微笑画面交给了大模型，视频中闪现了两个被“楚门”包围的场景，太离谱了！不知道AI从哪里学到了第二张图片，有一种可恨的熟悉感。

▲影片《楚门的世界》生成了一段视频，提示词是“这个人笑得很开心，挥手告别的画面”

此外，了解物理世界对Luma来说 AI仍然是一个没有解决的问题。当一位网友把Sheldon在美剧《生活大爆炸》中的剧照投给Dream时。 Machine，Sheldon在视频生成中的动作细节与物理不符。这是AI视频生成的一个老问题。

▲Sheldon在《生活大爆炸》中生成了视频

最严重的问题实际上是画质。Luma AI生成视频的粒子效果是可以接受的，但本来并不难，但是低视频帧率，想必是一般的计算能力，图像纹理和材料差，大部分都是低渲染材料，细节表现失真。

这个问题也让我很困惑，Luma 为什么AI画面的逼真度比Sora差那么多？Luma AI模型校准为2分钟120帧。为了保证导出率，图片质量会比较低，渲染速度快的时候会有低渲染材料。然后，如果我们尝试分辨率稍低的材料，例如，如果我使用电影《五星大鼠》，效果可能会...或者不太好。

▲影片《五星大鼠》生成视频

总的来说，Luma.AI表现的最佳部分是运动平滑度、运动水平，它还具有一定的内容感染力。，例如，可以在5s视频中添加与风格和内容一致的动态图片。图片不仅仅是动作顺畅，还比之前更加有趣，更加讲故事。

尽管运动和内容具有良好的感染力，Luma.AI也坦率地承认，目前模型存在。重现自然动作、变形效果和文本一些困难。但我认为，成像质量就是Luma。.AI最大的问题，视频帧率很低，画面纹理和材料经不起仔细观看，细节失真。

▲Luma.AI评分(来源：乌鸦智能说)

人类构图首先学习的是物理逻辑，AI的学习路径大不相同。无论是Sora的屏幕视频中有很多错误，还是Luma 各种“自爆”还需要改进的问题，目前我在表达Luma大模型的同时，也意识到模拟现实世界还需要冲关。

02 图片几乎无法使用，实际价值需要解决

除生成效果外，视频生成长度(约5s)、商品易得性(完全免费)也是Luma AI模型的亮点。

要知道OpenAI“重弹”Sora虽然可以根据提示生成1分钟的视频，但是还没有开发出第一个测试。另外，开放的Pika、基于原创模型的Runway和PixVerse等文化视频产品，生成视频的长度只有3-4秒，有些产品还有付费门槛。

所以，Luma更容易获得，完全免费。 AI是否具有更实用的例子价值？

对于创意视频生成，广告创作，电影特效对于这个比较专业的例子，答案是：Luma AI不行，Sora也不行。江江影视从业者告诉乌鸦君，Luma AI生成视频画面质量太低，很难使用。。今年二月，第一财经的一篇报道还提到，一位纪实片从业者认为Sora不能直接用于影视剧，因为精细度不够。

Luma AI视频工具对艺术表现这一块也不一定打得通。。上面提到的设计师@Simon_阿文也开始反思AI对作品的第二次创作。他认为产生的视频导致了风格偏差，因小失大。“比如这只熊...感觉自己在工作室”。设计师的风格暂时无法通过AI视频进行精细复制。

▲@Simon_阿文在作品中，狮子突然变成了卡通版。

03 英伟达看好，开放玩法有效吗？

AI生成视频跑道如火如荼，金融市场也表现出对视频生成领域的疯狂。今年3月，三名中国人创建了AI视频生成企业。（Haiper、爱诗科技、HeyGen）聚集在一起获得融资，融资金额超过千万美元。

Luma AI的融资过程也很顺利，截至今年1月，Luma AI已经筹集了超过7000万美元。A轮融资2000万美元，投资者包括Amplify Partners、英伟达、General Catalyst等。B轮融资4300万美元，a16z领投，Anjey Midha、Amplify、Matrix、参与英伟达等。

Luma 推动Dream的AI开放策略 Machine可以被所有人使用，这可能会使它在建立开发者和创作者社区方面具有显著的优势。据悉，Luma AI计划发布API和插件，将Dream Machine与流行的创意软件集成，进一步扩大其影响力。

从另一个角度来看，Luma团队可能无法获得足够的信息训练，所以他们不得不打开它来收集数据。然而，更好的视频生成项目可能不会打开，因为他们担心垃圾数据会降低AI的实践。

▲网站支持模型中Luma存在的问题

04 结论：AI视频生成正在普及

在过去，我们无法想象AI视频可以像Sora一样精细。、Luma这样的程度，从文生文到文生视频，图生视频，也只用了一年。Luma AI视频的质量令人惊叹，但是现在，它们除了作为展示AI潜力的案例外，还需要观察实际的落地价值。

Luma 等待AI生成视频工具的开放和收费，预示着AI视频工具的商业化将会加快。影视从业者江江也告诉乌鸦君，从视频制作人的角度来看，Ta认为这将成为一件技术困难的事情，AI已经突破或有突破的迹象。也许AI视频生成普及到实际落地的那一天不会让我们等太久。

本文来自微信微信官方账号“乌鸦智能说”（ID:wuyazhinengshuo），作者：智能秃鹫，36氪经授权发布。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

稳定？L3的大规模落地指日可待，激光雷达企业成为首批赢家

原价129炒成6500，玻璃门全部“挤爆”，到底什么是“哦崽”？

除迟到的计算器外，iPadOS 18 还有哪些变化值得注意？

火灾成功，2600亿龙头盘中涨幅超过9%，投资者大呼后悔：卖得早。

失业后的大厂高P，都去做了什么？

项目推荐

迪瓜租机

康老板 · 氧疗堂