开源企业哭CEO,闭源11人赚2亿美元,这家AI企业舍命转向了CEO。

05-20 21:19

许多专业的AI绘画爱好者一直在等待Stable Diffusion 3发布,从年前期待到年后,现在看来,很有可能等不到开源安装包。


5月份,Stability AI 宣布推出 Stable Artisan,宣布希望能让更广泛的受众使用。 Stability AI 的 Developer Platform API 功能。


许多人对这个产品感到困惑,这个产品是什么?根据官方消息,Stable Artisan 它具有Stability AI 高级型号,例如 Stable Diffusion 3、Stable Video 和 Stable Image Core,使用者可直接接受 Discord 建立高质量的媒体。


去Discord什么? 不是单独的本地安装程序吗?不得不说,开源赚钱太难了。4月,Stability在Stability上 AI 在CEO都要辞职的背景下,企业舍命要从开源到闭源,也是情有可原的。


毕竟依靠Discorddey,看看闭源AI绘画软件Midjourney。 社区付费使用,预计2023年营收将达到2亿美元,但是团队只有11人,简直就是躺着数钱。


Discord 与MJ相比,中SD有什么特别之处?


Stability AI终于走上了midjourney的道路,在Discord上搭建了一个频道,收取了生图/生图/图片放大/背景删除等功能。支持的图像和视频模型包括Stabley Diffusion 3、Stable Video 和Diffusion和Stable Image Core。


单击链接即可进入官方Discord服务器:https://discord.com/invite/stablediffusion


第一,使用文生图。进入discord服务器后,进入ARTISAN频道,任意选择一个:


然后在输入框中输入“/dream”,会显示没有权限,点击https://stability.ai/stable-artisan#choose-stable-artisan-Plan链接,注册帐号后填写信用卡信息和地址,可免费试用三天,三天后开始收费。


Stable初期 与Midjourney相比,Diffusion最大的区别就是“详细”,可以调整各种参数,使用起来比较复杂,适合专业人士使用。现在,这些参数也被移动到Discord上,输入框中会提示用户输入以下五种参数:


negative从上到下分别是- prompt(负面提示)、seed(种籽值)、aspect(宽高比)、model(模型)、image(照片张数)


让我们看看图片的效果如何:


Stable Artisan还有两个特殊技能:


草图:粗糙的手绘草图通过精确的控制升级为详细的导出。对于非草图图像,允许使用图像中的轮廓线和边缘对最终外观进行详细处理。


结构:通过维护输入图像的结构来生成图像,对于高级内容创建方案(例如,再次创建场景或从模型中渲染角色)尤为有用。


Stable升级核心架构 Diffusion


Stability AI官方表示,与SDXL相比,SD3的亮点在于其遵循字体和提示的能力,这在人类偏好的评价中得到了突出的体现。为了实现这一目标,SD3选择了一种新型多模态扩散变换器。(MMDiT)结构,这种结构改进了图像和表达的权重分离处理,从而显著提高了模型的文本理解和拼写能力。


SDXL升级到MMDiT架构,使SD3在理解和执行客户文本提醒时更加准确,生成的图像更符合客户的期望。


简单来讲,Stable 在生成文字时,diffusion会更加智能。事实上也是如此,上图中的“”CROZ-080-Develops“特别清楚,写作没有错误,如果使用Midjourney或Dalle,可能会得到一堆乱码。



除生图外,还有许多其它功能。比如扩大分辨率,


外扩:


删除背景:


功能比Midjourney丰富得多。然而,在生成视频方面,还有很长的路要走。因为采用了扩散模式,AI并没有真正理解物理规律,所以视频中的猫变形严重...


未来是开源还是闭源?


经历了总裁离职、核心团队解散的困境,Stability AI仍然坚持,SD3论文发布后,SD3API再次发布,Discord版本上线。


一个月前,百度董事长李彦宏的内部演讲透露,开源大模型泼了很多冷水。他说大模型开源意义不大,闭源模型在能力上会继续领先。


在内部演讲中,他给出的理由是,有商业模式的闭源模式可以聚集人力和资金。中国和美国最强的基础模式是闭源模式,最好的小模式是大模式降维模式,闭源在成本和效率上有优势。同等能力的闭源模式推理成本低,响应速度快。


另外一个原因是模型开源和Linux等传统软件开源、Android不一样。“虽然开源模型Llama也鼓励大家提供各种数据和代码,但实际上最重要的开发者是Meta,而不是真正大家一起开发的产品。”


李彦宏的演讲并非没有道理,目前,开源模型面临的最大挑战是商业化。过去Stable Diffusion 3 与此同时,外媒也传出了发布时间。 Stability AI 旗下图像生成应用企业 Clipdrop 收购消息。


总部位于巴黎 Clipdrop 创立于 2020 年 7 月亮,使用开源 AI 模型用户可以生成和编辑照片。在 2023 年 3 每月出售未披露的金额 Stability AI 以前,它已经从那里走了 Air Street Capital 收集种子投资。当时,Clipdrop 这意味着它拥有超越 1500 万用户。但是仅仅一年后,Stability AI 把它卖给美国写作助理初创公司 Jasper。


有些人评论说,Stable Diffusion 3 发布就是为了掩盖这个消息。还有许多。 AI 创业公司一样,Stability AI 面临的困境在于它以惊人的速度烧钱,但是没有明确的盈利方式。


去年年底,该公司也传出了这个消息 CEO 有可能被投资者赶下台的消息,公司本身也可能在寻找卖身。在这种背景下,Stability AI 迫切需要提高投资者的信心,Discord版本上线收费也许是为了解决燃眉之急。


本文来自微信公众号“AI鲸选社”(ID:aijingxuanshe),作者:鲸哥,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com