揭示AI伪造小杨哥音频:最低零成本,只需三秒钟。
在小杨哥事件中曝光的那段“卢文庆音频”,首先是内容规模太大,引起舆论哗然,随后又被发现全是AI伪造。
随着时间的推移,AI技术再次被推到风口浪尖。
图/言域科技官方回复
无论技术好坏,AI生成的音频本质上都可以理解为一种Deepfake,即利用深度学习算法来模拟和伪造音视频,即通过人工智能技术中的深度学习模型,将人的声音、面部情绪和身体动作拼接在一起,形成非常逼真的虚假内容。 。
从技术上讲,这是中性的,除了语音模拟之外,类似的方法还包括AI变脸、人脸生成、视频生成等,统称为深度伪造。
但是,中性技术,架不住用户心怀不轨。
蓝媒汇咨询了国内头部AI数字人企业风平智能创始人兼首席执行官林洪祥。对于这类事件,林洪祥直言,AI带来的生产效率提升是全方位的,但在“应用”扩展的过程中,恐怕违规事件需要系统的规范和有效的实施。
根据行业目前的技术水平,用户只需要找到几分钟的零散材料作为AI的学习样本,就可以快速复制出完整的AI声音。通过技术手段,可以调整和调整音频中的一些说话挫折和情绪语气。
而且,在实际应用阶段,复制一套AI人声的成本“现在已经不高了”,市场上的很多应用都会给一些免费的入口。以涉及的模型为例,Reecho智能声音模型提供免费的声音克隆服务,更专业的版本需要付费。
将卢老板从网上截取的一段直播转化为音频导入,短短几秒钟后,卢老板的AI声音就被复制出来了。
再次模仿原来事件中情绪和文字都非常离谱的一段音频,作为脚本导入模型,一段卢文庆锐评马斯克的录音,就完成了。
“小马,他们走了,对吗?我告诉你,我想让任何人生气就让任何人生气,明白吗?我认识更多的首席执行官。我不会支持任何人。别跟我提马斯克,不好用,知道不,不好用,我们喝酒也不好用。他是什么?没有三只羊。谁来给他卖货?你明白这个道理吗?”
坦白说,如果你听了太多的AI诈骗电话或者对声音敏感,其实可以听到AI音频有一种“机器感”——语气从头到尾都太稳定了,人在情绪激动的时候永远不会这样。但这只是最基本的普通模型和瞬间复制功能。如果有更多的语料材料,选择专业的复制功能,效果会更“真实”。
所以,AI生成的音视频,有没有可能像测谎仪一样更直观地通过数据来辨别真假?
在技术层面,这是合理的。林洪祥表示,除了用户本人的授权外,AI数字人行业确实有相关标准正在建设中,要求在各种AI生成的内容中加入特殊的“特征标志”进行识别。
这个标签不是简单的在角落里加一个“XX” AI生成“水印”,以AI生成的声音为例。它会在人们说话的声音频段之外添加额外的噪声频段,甚至在可见的声音范围内添加一定的特征频段。
这一特征频率可以由机器识别,如果需要进行鉴定,交给设备提取这些频段,理论上可以判断真伪。
但是目前愿意普及这个功能的公司并不多,没有其他限制因素,主要是多一个程序产生的成本——虽然一次使用模型的成本不高,但是对于目前的AI公司来说,每个音视频模型在预训练阶段的投入和阶段性输出后开发下一代音视频模型所形成的成本还是有很大压力的。
当前,AI音视频行业还处于起步阶段,如何在推广阶段获得客户的同时覆盖成本,是从业者无法回避的话题。
但是以上这些,显然都不是心怀不轨的犯罪分子会考虑的事情,烟火或炸弹的关键在于如何使用炸药。
半年多前,香港警方披露了一起诈骗案,涉案金额高达2亿港元。案件中,一家跨国公司香港分公司的员工收到总部CFO的通知,称总部正在计划一笔“秘密交易”,需要将公司资金转入香港几个本地账户备用。
随后,员工被邀请参加总部发起的“多人视频会议”,并按会议要求将2亿港元转账15次,转入5个银行账户。
事实上,除了分公司的员工,这次多人视频会议的其他“人”都是诈骗分子利用公开音视频切片生成的AI形象,然后通过视频电话会议改变脸型和声音,诈骗团队直接成为高管团队发号施令。
在香港案件中,犯罪分子相当于用AI变脸。 AI变声器的真人出现了,而小杨哥这次的AI伪造音频都是在大模型学习了三家羊企业卢文庆的相关音频素材后,生成的整个音频,语气和情绪都接近真人。过程就这么简单——AI生成音视频已经是一项成熟的技术,相关产品已经发展成为一个完整的行业。
然而,AI生成音视频的主流绝不是欺诈。在《流浪地球》第二部的故事中,刘德华饰演的图恒宇用数字生命复活了丫丫,但在故事之外,已故的著名电影明星吴孟达也在使用它。 AI 现身荧幕。
所以,如果以后再发生类似小杨哥的音频事件,讨论技术是有罪还是无罪,最好先把人控制住。
管理人性,拯救AI。
本文来自微信微信官方账号“AI蓝媒汇”,作者:陶然,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com