刘强东“分身”惊现!京东要打什么牌?

商界观察
04-17 15:00

 

4月16日傍晚,采用刘强东形象的“采销东哥”AI数字人与观众见面,在京东家电家居、京东超市采销直播间亮相。

 

京东官方消息显示,“采销东哥”AI数字人是由京东云言犀制作的高逼真大姿态数字人,凭借多角色、个性化的闲时带货能力,言犀数字人已服务了超过4000家品牌直播间。

 

采销东哥AI数字人的此次亮相,更像是一次广而告之:

 

数字人技术已经成熟,足以胜任品类直播的工作。

 

其实,在春节闲时直播中,京东云言犀数字人就曾卖出过4000万元货品,平均提升闲时直播转化率超30%。

 

值得一提的是,近期京东已经申请注册“老刘专场”“优京家品”“圆头价”等商标,国际分类涉及广告销售、服装鞋帽等,当前商标状态均为等待实质审查。

 

“刘强东”的直播首秀

 

“京东超市就是便宜,给东哥评论刷起来!”
 

“500单一分钱的爆香鱼上链接……”
 

“准备红包雨开抢!”
 

 

直播期间,刘强东的数字分身流利地介绍玉米、牛排等商品,并进行茅台等实物抽奖以及红包发放。

 

在京东超市采销直播间,刘强东“数字人”回想起创业时:

 

“今天坐在这里不得不感叹时间过得真快,一转眼京东已经成立超过20年了。
 

京东最开始做电商时,网络购物刚刚兴起,可以选择的商品很少,假货、劣质货还特别多。

 

我创立京东就是想让大家买到的商品方便、快速、便宜,还要保证产品质量。”

 

接着,他开始带货了——

 

“今天这场直播我主要想跟大伙儿聊聊我这几年在饮食方面的调整,也给大家推荐一些我自己在吃,平时也会在家做的健康食品,分享给你们健康的饮食方式。”他首先推荐了一款麦片:
 

“说到在家里做饭,咱们得从一日三餐开始聊。
 

首先东哥跟大家聊聊早餐,俗话说早吃饱,午吃好,晚吃少,早餐的地位不言而喻了。
 

我呢,一般会选牛奶麦片,再加点蓝莓,这样搭配营养够,热量又低,吃起来还挺舒服的。”

 

而在京东家电家居采销直播间,刘强东“数字人”则在超级观赛客厅向大家打了声“好久不见,我是你们的采销东哥”的招呼,并表示和大家一起期待欧洲杯。

 

他首先介绍的是一台75英寸的电视机:


“这款电视是今年3月刚上市的新品,不仅外观大气,更是内涵满满。无论是画质音质还是智能配置,都是行业内的佼佼者。”

 

 

刘强东“数字人”在带货过程中还会时不时操作手机,回复消息。

 

直播间的网友质疑就是真人直播——
 

细看采销东哥AI数字人,不仅复原了刘强东语速快和连音多的口头习惯,还复刻了他搓手指、略微仰头的习惯动作和身体姿态,直播中还有非常自然地看手机的动作。

 

数字人仿佛具备了百科全书版的数字大脑,完美胜任了“首席采销”的工作。

 

刘强东的数字人为何这么“真”

 

听过刘强东演讲的人一定印象深刻。

 

他讲话很少犹疑,让人觉得自信坚定;

 

同时平易近人,用简单的词汇讲述波澜壮阔的故事。

 

讲完一段,他还会抛出事先准备的金句。

 

这时,观众会突然爆发出脱口秀现场般的笑声和掌声。

 

这次直播的数字人就还原出刘强东真人的风采:
 

不仅声音惟妙惟肖,说话的语调和习惯也别无二致。
 

也难怪有人在微博上发问:数字人是怎么做到这么“真”的?

 

京东云言犀技术团队透露:
 

要让数字人逼真,首先需要还原出刘强东的声音。
 

言犀团队原本打算使用他在2017年的一段演讲音频作学习素材,但经过测试发现:
 

当时演讲的语气用于直播带货过于正式。
 

因此,言犀团队又录制了一段刘强东30分钟的闲谈,让他畅聊自己的旅行经历。这段神采飞扬的声音就成为底本,提取出声学特征后,通过言犀语音大模型合成出人工语音。
 

其实,言犀团队已经可以做到最短使用6秒素材,就能复现一个真人的声音。
 

而更长的声音素材,无疑有助于捕捉更多丰富的细节。复现出音色以后,还需要捕捉声音的“副语言”。
 

副语言是人们说话的习惯,比如语速、语调、重音、倒吸气。
 

即使音色变化,比如感冒或者电话通话,凭借副语言也能辨认出说话的人。
 

如果没有副语言,声音就会缺乏情绪、显得过于“正确”和冷冰冰。

 

刘强东讲话也有自己的副语言:语速快、连音多、吐字较轻。
 

例如“跟着”的“着”字经常被一笔带过。
 

“时间”中的“sh”会有更重的鼻音,后鼻音有时会被吞掉,变成前鼻音。
 

他讲话也很少有辅助词,句子间衔接顺畅,只会在寻求认同时用“啊”来衔接。
 

说到重点时,他还会加重重音,让人不自觉地竖起耳朵。

 

捕捉这些副语言的技术,被称为“风格迁移”:
 

把原本声音的特征迁移到人工合成的声音中。
 

这些副语言原本分布稀疏,大模型不容易捕捉到规律,但言犀团队将声音样本的重音、语调等拆解成音素,让模型能更清晰地注意到它们。
 

在文本层面,NLP(自然语言处理)模型则会根据真人习惯添加口头语,让声音更像真人。

 

数字人直播

让商家抓住技术红利

 

数字人直播对京东并非技术秀场,而是锱铢必较的商业场景。
 

截至2024年4月,已经有超过4000个品牌在京东使用数字人直播,用来接替真人完成闲时直播。
 

它们能提升闲时转化率超30%,成本却不到真人直播的1/10。
 

春节就是典型的闲时直播场景:观众观看时间分散、往往没有明确购买目标。可以说,数字人直播已经成为商家低成本营销的必备手段。

 

据电商行业数据,在2023年,直播带货在电商的渗透率约为31.9%,成为零售的普遍形态。

 

然而,直播带货每场开播都有不小的成本,大约每场数万元,这让精打细算的品牌商家头疼不已。
 

有直播电商资深运营直言:“大部分品牌,过去两年的直播都是亏损状态”。
 

不仅成本贵,真人主播还只能应付每天的黄金时间,背后选品、脚本、互动都要其他人配合。
 

这样高昂的成本,使得很多商家被排斥在直播带货之外。

 

“对预算有限的品牌来说,数字人直播是高性价比的选择”,大宝京东渠道负责人袁航表示。

 

也有商家说,数字人直播“播了就比不播强”。

 

“采销东哥”AI数字人亮相采销直播间,无疑是京东对低价主张的一次展示:

 

京东采销直播,是以减少商家营销成本的方式,让消费者拿到便宜好物,让商家赚到合理利润。

 

而以数字人为代表的技术解决业务问题,并把自身的成熟实践成果开放给更多伙伴,则是京东始终遵循的路径。

 

本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com