AI可以让任何大模型张嘴说话,引擎有什么玄机?

03-21 09:34

杨浦集中发布了一系列公司创新项目,主题是在杨浦区近日举行的科技创新大会上,共建“杨数浦”新质秀带。



其中,声网对话式 AI 引擎引人注目,这款引擎可以支持随机文本大模型快速升级为“口若悬河”的对话多模式大模型。同时,对话 AI 发动机的价格也比较优惠,1分钟不到1毛钱,每分钟只需0.098元。


在生成式 AI 在这一浪潮下,业界普遍认为多模态大模式是实现的。 AGI 必经之路,知名投资机构 a16z 最新关于 Voice AI 报告还显示,随着大型模型的不断发展,语音将成为一个关键的切入点。作为世界实时互动云行业的开拓者,声网在音视频领域积累了深厚的技术优势和场景实践,一直致力于将其 RTE 与生成式 AI 结合起来,推出了对话式。 AI 发动机,带给开发者“多快多省” AI 语音对话的感觉。



真正把决定权交给开发者。支持包括 DeepSeek、ChatGPT 包括世界上大多数大型模型制造商。还支持全球主流语音合成供应商的随机转换,支持开发商通过语音合成供应商定制的自定义音质访问。有更多的音频和视频 SDK 支持 30000 适应终端型号,处理多设备兼容性的后顾之忧。



在中、美、欧、东南亚主要城市,通过全链路深度推广,语音对话延迟中位数低至中位数。 650ms,让 AI 秒回你的问题。极低的中断延迟,自主研发“智能中断”技术,模拟真人对话节奏,随时中断和中断。 AI 对话响应低至340ms。


选择性注意锁定功能可以屏蔽95%的环境声音和噪音干扰,准确识别对话声音。另外,对话 AI 发动机具有优良的抗弱网、防丢包能力,80% 在丢包率下,对话依然顺畅顺畅,断网3-5s 对话依然顺畅。


声网对话式 AI 发动机提供了一个简单的开发部署,只需2行代码,15分钟就可以使用。 AI 开口说话,大大降低了开发门槛。只需填写并复制即可。 LLM 与 TTS 有关的 URL 与 Key,可以实现快速部署,相关流程可以查看声网官网的文档中心。



对话式 AI 发动机的成本也更高,AI 语音对话每分钟只需0.098元,每次赠送1000分钟。作为增值服务,声网自主研发的“智能中断”功能只需要0.042元/分钟,帮助开发者以更低的成本探索。 AI 应用领域。


声网 AI RTE 产品线负责人姚光华说:“经过一段时间的与客户打磨和实际使用场景调查,我们统计了用户和用户。 AI 每次对话发生时,平均值将有3轮左右的问答,平均对话时间约为21.1。s,一次性费用只有3分钱。假如每月谈话频率为15次,那么每月的费用不到5分钱,每年的费用也只有5元。”


通过声网对话式 AI 发动机,开发者可以快速部署智能助手、虚拟陪伴、口语陪练、智能客服、智能产品等对话式 AI 场景。例如,智能助手场景可以帮助我们管理日程、信息查询和执行任务,通过自然语言交互,全面提高生活便利性和工作效率。


目前智能化的产品场景也很火爆。 AI 场景,通过嵌入对话式 AI 发动机可以实现语音控制、智能护理、智能陪伴和人性化服务,将智能产品升级为智能产品。适合 AI 玩具、AI 教育硬件、AI 伴侣设备、家庭语音助手、穿戴设备个人助手等多种应用领域。


文字成佳佳


编辑|文茜婷


*转载请注明上海杨浦官方微信。


标题:“AI,可以让任何大模型张嘴说话,引擎有什么玄机?”


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com