13天涨粉22万，全美爆红的“婴儿播客”，凭什么获得2亿美元的估值？

2025-06-13

“可爱”又赢了

全世界的明星都有“宝贝播客”，我的X、TikTok被刷屏了！

在这些爆款视频中，“AI宝宝”不仅外表与名人相似，而且表情、口型、动作都非常生动，充满感染力。视频往往播放数千万，赞数百万，相关账号如“babypodcast"13天涨粉超过22万。

它的幕后推手Hedra也宣布完成了A16z领先的3200万美元A轮融资，估值高达2亿美元。

Hedra以AI对口工具命名，以“角色可控”和强调细致的表现力打败了一批视频工具。同时，它也是一个整合外部模型的“全模式”平台，以“复杂流程模块化”的理念处理生成AI工具过于分散的痛点。

今日，我们将拆解这个“婴儿播客”的爆红密码，并探索Hedra背后工具的魔力。

01 Hedra的“全模态”制作平台再次获胜，拆解Hedra。

“婴儿播客”的关键配方是“名人萌化” “成人叙述”产生好奇心，形成独特的裂变传播因素。

外国喜剧表演一般表情夸张，内容辛辣，这与表情娇憨、不懂世事的婴儿形象形成鲜明对比。

这类内容深知“借势传播”，制作门槛也很低。

创作者直接截取当前爆款内容，如TheoVon等喜剧明星的经典台词，《10000》-Lb.Sisters》有争议的真人秀片段，利用原有内容自带的粉丝基础和话题度，让“AI宝宝”重新演绎。

▲喜剧演员JonLajoi制作的婴儿访谈狗播客成为爆款视频

这种视频的制作方法很简单，整个过程可以在Hedra 在Studio上完成。该平台以Hedra自主研发的Character-3模型为核心，生成与编辑一体化，三个步骤可以结束战斗：

①GPT分析名人特征，生图模型制作其婴儿形象

GPT推送名人特征提示，即梦想、Midjourney等图片模型产生相应的婴儿形象。还需要预留一个动态的面部空间，比如张开的嘴巴和自然的表情，为后续的嘴型同步做准备。

举例：photo realistic elonmuskasa baby in a teslat-shirt sitting in front of apodcastmic，elonmusk face(埃隆·马斯克的婴儿形象，穿着特斯拉t恤，坐在播客麦克前，埃隆·马斯克的面部特征)

②配音“AI宝宝”，可以生成或截取音频。

声音可以截取热门播客或影视片段的原声；而定制内容依赖于ElevenLabs、生成像MinimaxSpeech02这样的语音模型，可以选择嘶哑、戏谑或夸张的音色来增强喜剧效果。

③让“AI宝宝”“说话”

将图像和音频上传到Hedra 后，Character-3模型开始发挥作用:首先分析宝宝脸部的关键点(如嘴角、眼球、眉毛)，然后根据音频的音准、节奏、语义情绪生成相应的微表情。

▲“AI婴儿”歇斯底里的表情再现了《Top Gear》主持风格

Hedra不仅可以将人物的嘴与语音相匹配，而且可以使表情和姿势与语音内容高度一致。

比如音频中出现笑声时，AI会同时触发“宝宝”眯眼、嘴角上扬的动作。它的音画同步精度可以达到毫秒，甚至可以模拟吞咽、眨眼等细节，让静态图像几乎生动。

事实上，在“婴儿播客”病毒传播之前，Hedra就因为制作吉卜力风格的播客视频而火了一次。

成年人对可爱风格(包括动画美学、可爱文化、简化视觉语言)的接受度很高，这两次爆红反映了一个内容趋势。

根据剑桥大学的测试数据，人脑处理卡通形象的情绪反应速度比真人快0.3秒。AI营销可以用婴儿/吉卜力等低威胁形象承载复杂的信息内容。

自2024年推出Character-3模型以来，Hedra成立于2021年，迅速积累了300万用户，并筹集了资金：

1000万美元种子轮投资于2024年8月完成。

由a16z领投的3200万美元A轮融资于2024年11月完成。

获得亚马逊Alexa基金今年3月的投资

目前公司估值2亿美元，累计融资4400万美元，核心用户群为专业创作者和销售人员。目前团队规模只有20人，预计将迅速扩大到三倍。

02 2年融资4400万美元，可控性是破局的关键。

“婴儿播客”AI技术是对内容生产范式的一次考验。

Hedra的价值不仅仅在于实现娱乐流量，Hedra透露，其未来计划将重点放在公司营销领域。

今年6月，Hedra在其科技周活动中积极与创作者互动，并展示了其在公司服务方面的概率。当Hedra Character-3模型动态生成能力可以与数字人技术相结合，或者可以大大降低企业客户服务、虚拟偶像影视配角的生产成本。

纵观整个生成式AI领域，竞争并不激烈。——Captions、HeyGen、围绕视频和虚拟形象，Synthesia和Runway等热门公司正在构建技术。

许多工具卷4k、“恐怖谷”——动作僵硬，表情空洞，缺乏人类细腻的情感层次，画面精美，产生的内容依然经常出现。

为了打破这个“恐怖谷”，Hedra做了两个步骤。

第一，Hedra是可控的。

通过GPT分析名人特征→生图模型生成婴儿版IPIP→动态绑定表演风格，Hedra将原本“不可控的艺术表现”转化为“可量产的精准情感触达”，实现了IP的低成本萌化和重塑。

其次，Hedra测胜于人物的表现力。

其“面部选择”和精确的唇形同步控制等功能，都体现了团队对时间、情感协调、多元化角色表达的敏感程度。

MichaelaHedra创始人 Lingelbach本人曾经是一名舞台演员，他对人物的动态演绎有着深刻的理解。

Hedra通过可控性和感染力，完成了品牌对营销市场的适应。

另外，分散的生态学是生成AI工具的一大痛点。

例如，HeyGen最多可以制作30分钟的视频，但是多个角色的协同生成仍然是一个缺点。TalkingAvataratar等少数支持双角产生的工具 AI，Notebook仍然需要组合使用LM，工艺繁琐，兼容性有限。

集成外部模型的Hedra平台全过程能力“文本输入-图像生成-语音合成-多角色动画-智能编辑”，可以根据客户设定的风格自动匹配性能参数。

今年6月，Hedra更新了“人脸选择”功能，用户可以在多个角色场景中选择人脸“张嘴说话”，从而弥补了多个角色产生的不足。

正如Hedra创始人所说:“未来的创作者不应该是工具操作者，而应该致力于创造自己。技术需要成为无形的基础设施，而不是显性的门槛。”

本文来自微信微信官方账号“秃鹫智能说”，作者：智能秃鹫，36氪经授权发布。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

特斯拉的“光晕”褪色：华销八连降背后的四个“围城”

2代LeCun世界模型，62小时机器人训练，开启物理推理新时期。

JK少女不爱Labubu，耍“袖白雪”

Xbox掌机真的来了，但是可能和你想的有点不一样。

今年618，短剧营销还好吗？