13天涨粉22万,全美爆红的“婴儿播客”,凭什么获得2亿美元的估值?

06-13 11:48
“可爱”又赢了

全世界的明星都有“宝贝播客”,我的X、TikTok被刷屏了!



在这些爆款视频中,“AI宝宝”不仅外表与名人相似,而且表情、口型、动作都非常生动,充满感染力。视频往往播放数千万,赞数百万,相关账号如“babypodcast"13天涨粉超过22万。


它的幕后推手Hedra也宣布完成了A16z领先的3200万美元A轮融资,估值高达2亿美元。


Hedra以AI对口工具命名,以“角色可控”和强调细致的表现力打败了一批视频工具。同时,它也是一个整合外部模型的“全模式”平台,以“复杂流程模块化”的理念处理生成AI工具过于分散的痛点。


今日,我们将拆解这个“婴儿播客”的爆红密码,并探索Hedra背后工具的魔力。


01 Hedra的“全模态”制作平台再次获胜,拆解Hedra。


“婴儿播客”的关键配方是“名人萌化” “成人叙述”产生好奇心,形成独特的裂变传播因素。


外国喜剧表演一般表情夸张,内容辛辣,这与表情娇憨、不懂世事的婴儿形象形成鲜明对比。


这类内容深知“借势传播”,制作门槛也很低。


创作者直接截取当前爆款内容,如TheoVon等喜剧明星的经典台词,《10000》-Lb.Sisters》有争议的真人秀片段,利用原有内容自带的粉丝基础和话题度,让“AI宝宝”重新演绎。


▲喜剧演员JonLajoi制作的婴儿访谈狗播客成为爆款视频


这种视频的制作方法很简单,整个过程可以在Hedra 在Studio上完成。该平台以Hedra自主研发的Character-3模型为核心,生成与编辑一体化,三个步骤可以结束战斗:


GPT分析名人特征,生图模型制作其婴儿形象


GPT推送名人特征提示,即梦想、Midjourney等图片模型产生相应的婴儿形象。还需要预留一个动态的面部空间,比如张开的嘴巴和自然的表情,为后续的嘴型同步做准备。


举例:photo realistic elonmuskasa baby in a teslat-shirt sitting in front of apodcastmic,elonmusk face(埃隆·马斯克的婴儿形象,穿着特斯拉t恤,坐在播客麦克前,埃隆·马斯克的面部特征)


②配音“AI宝宝”,可以生成或截取音频。


声音可以截取热门播客或影视片段的原声;而定制内容依赖于ElevenLabs、生成像MinimaxSpeech02这样的语音模型,可以选择嘶哑、戏谑或夸张的音色来增强喜剧效果。


③让“AI宝宝”“说话”


将图像和音频上传到Hedra 后,Character-3模型开始发挥作用:首先分析宝宝脸部的关键点(如嘴角、眼球、眉毛),然后根据音频的音准、节奏、语义情绪生成相应的微表情。


▲“AI婴儿”歇斯底里的表情再现了《Top Gear》主持风格


Hedra不仅可以将人物的嘴与语音相匹配,而且可以使表情和姿势与语音内容高度一致。


比如音频中出现笑声时,AI会同时触发“宝宝”眯眼、嘴角上扬的动作。它的音画同步精度可以达到毫秒,甚至可以模拟吞咽、眨眼等细节,让静态图像几乎生动。


事实上,在“婴儿播客”病毒传播之前,Hedra就因为制作吉卜力风格的播客视频而火了一次。


成年人对可爱风格(包括动画美学、可爱文化、简化视觉语言)的接受度很高,这两次爆红反映了一个内容趋势。


根据剑桥大学的测试数据,人脑处理卡通形象的情绪反应速度比真人快0.3秒。AI营销可以用婴儿/吉卜力等低威胁形象承载复杂的信息内容。


自2024年推出Character-3模型以来,Hedra成立于2021年,迅速积累了300万用户,并筹集了资金:


1000万美元种子轮投资于2024年8月完成。


由a16z领投的3200万美元A轮融资于2024年11月完成。


获得亚马逊Alexa基金今年3月的投资


目前公司估值2亿美元,累计融资4400万美元,核心用户群为专业创作者和销售人员。目前团队规模只有20人,预计将迅速扩大到三倍。


02 2年融资4400万美元,可控性是破局的关键。


“婴儿播客”AI技术是对内容生产范式的一次考验。


Hedra的价值不仅仅在于实现娱乐流量,Hedra透露,其未来计划将重点放在公司营销领域。


今年6月,Hedra在其科技周活动中积极与创作者互动,并展示了其在公司服务方面的概率。当Hedra Character-3模型动态生成能力可以与数字人技术相结合,或者可以大大降低企业客户服务、虚拟偶像影视配角的生产成本。


纵观整个生成式AI领域,竞争并不激烈。——Captions、HeyGen、围绕视频和虚拟形象,Synthesia和Runway等热门公司正在构建技术。


许多工具卷4k、“恐怖谷”——动作僵硬,表情空洞,缺乏人类细腻的情感层次,画面精美,产生的内容依然经常出现。


为了打破这个“恐怖谷”,Hedra做了两个步骤。


第一,Hedra是可控的


通过GPT分析名人特征→生图模型生成婴儿版IPIP→动态绑定表演风格,Hedra将原本“不可控的艺术表现”转化为“可量产的精准情感触达”,实现了IP的低成本萌化和重塑。


其次,Hedra测胜于人物的表现力


其“面部选择”和精确的唇形同步控制等功能,都体现了团队对时间、情感协调、多元化角色表达的敏感程度。


MichaelaHedra创始人 Lingelbach本人曾经是一名舞台演员,他对人物的动态演绎有着深刻的理解。


Hedra通过可控性和感染力,完成了品牌对营销市场的适应。


另外,分散的生态学是生成AI工具的一大痛点。


例如,HeyGen最多可以制作30分钟的视频,但是多个角色的协同生成仍然是一个缺点。TalkingAvataratar等少数支持双角产生的工具 AI,Notebook仍然需要组合 使用LM,工艺繁琐,兼容性有限。


集成外部模型的Hedra平台全过程能力“文本输入-图像生成-语音合成-多角色动画-智能编辑”,可以根据客户设定的风格自动匹配性能参数。


今年6月,Hedra更新了“人脸选择”功能,用户可以在多个角色场景中选择人脸“张嘴说话”,从而弥补了多个角色产生的不足。


正如Hedra创始人所说:“未来的创作者不应该是工具操作者,而应该致力于创造自己。技术需要成为无形的基础设施,而不是显性的门槛。”


本文来自微信微信官方账号“秃鹫智能说”,作者:智能秃鹫,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com