新作《ControlNet》爆红：P照片换背景不求人，AI照明完美融合。

2024-05-16

ControlNet作者的新作，玩得很开心，刚开源就揽星1.2k。

用于操纵图像照明效果的IC-Light，lmposing全称 Consistent Light。

游戏非常简单：

随便上传一张图片，系统自动将人物等主体分开，选择灯源位置，填入提示词，就可以毫无瑕疵地融入新环境！

赶快来个王家卫式的打光：

不喜欢？

没关系，换成窗外的太阳光，也就是分分钟的事情。

目前，IC-Light提供两种模型：重点照明模型的文本条件，还有背景条件模型。

这两种模型都需要以前景图像作为输入。

由于Controlnet之前太有趣了，这次IC-Light一出现就备受关注，有网友迅速制作了ComfyUI插件。

(疑惑，大家这么拼，都不睡觉？)

无论是期望值还是使用后的感觉，网友们都给予了很高的回报：

Nice！迫不及待地想上手玩嘻嘻嘻。

01 谁能帮助我改变这张图片的背景？

每一个时代，从古代MCN到贴吧再到现在的小红书，都不乏“谁能帮我换个背景”这样的求助贴。

但是热心网友的支持，一般都是这样的：

就离谱。

但说实话，这种需求不仅存在于你我普通人之间，电商制作商品海报时，也常常有类似的需求。

有了IC-Light，似乎一切都变得简单了。

上传主体原图选择灯源位置提示词，完事儿。

来看效果——

这样的佛像原图，加上提示词“佛像，一丝不苟的脸，科幻RGB发光，赛博朋克”，再选择“光从左边打来”。

可以得到一个全新的成品：

即使是日常场景也是适用的。

最后的效果肉眼看还是挺自然的：

按照网友分享的评价，动画场景也适用…

02 背后技术

如前所说，IC-现在Light提供了两种模型，两种模型都需要以前景图像作为输入。

一类是重点照明模型的文本条件。

简而言之，用户可以通过输入提示来完成生成。

比如输入“左光源”、“月光”等，模型就会通过这些提示词和初始潜变量，生成符合要求和特征的图像。

另一类是背景条件模型。

这就更简单了，不需要复杂的提示，模型结合背景信息提示，对前景物体进行不同风格的照明变化。

其背后的技术原理，通过潜在空间的一致性，可以保证模型导出在不同的灯源组合下具有一致性，从而稳定地产生各种照明效果。。

详细如下——

在HDR空间中，所有照明的光源传输都是相互独立的，数学(即理想状态)中不同光源的外观混合效果与多灯源直接作用下的外观是一致的。

以上图片的照明阶段为例。来自“外观混合”和“光源混合”的两个图像是一致的(理想情况下，在HDR空间中等同于数学)。

所以，研究人员在练习再照明模型时，在潜在空间中使用多层感知机。（MLP）使不同光源的组合和传输具有一致性，并用于指导生成效果。

最后产生高度一致的再照明效果。

由于模型采用了潜在的扩散技术，因此可以在潜在的空间内实现学习和重光操作，从而在各种光照条件下产生高度一致的效果。

这类结果十分一致——尽管在训练过程中，模型没有直接使用法线图数据，但是可以将不同的重新照明合并成法线图。

看看下图，从左到右依次是输入、模型导出、再照明、分割阴影图像和合并法线贴图。

本文来自微信微信官方账号“量子位”（ID：QbitAI），作者：关注前沿技术，授权发布36氪。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

十年磨一“图”，谷歌震惊地发布纳米人脑图谱，AI加持人脑研究。

广东省教育考试服务中心-广东省27所高校进入全球前1%！

乾易网李计忠和李玮先生的大型环境布局案例

AI 后PC时代：再一次了解大型模型的最佳媒体

解读TO B软件企业财务报告：回放2023，展望2024

项目推荐

梯影传媒

AI云印侠

数策智检