GPT-4的总体超过 Turbo,最强大的国产模型发布

2024-06-30

讯飞星火 V4.0 来了!6 月 27 日本,科大讯飞在北京发布了讯飞星火大模型 V4.0 以及相关的落地应用。讯飞星火 V4.0 七大核心能力全面提升,整体超越 GPT-4 Turbo,在 8 国际主流测试集中排名第一,国内大型模型全面领先。


大模型个性化时代到来!讯飞星火 APP/Desk 全新升级,发布“私人空间”,打造更了解你的空间。 AI 助理;面向专业领域的个性化应用,科大讯飞升级讯飞晓医 APP,推出个人数字健康空间,打造每个人的健康助手;星火智能审阅机在行业内首次推出, AI 助教“帮助教师减负提质,因人施教;讯飞 AI 学习机升级 1 对 1 答疑指导功能,创造每个孩子 AI 学习助手。


面向万物互联时代,星火语音模型再次突破,发布 74 个语种 / 方言不转换对话,解决影响场景语音识别的强大问题,发布世界领先的极其复杂场景语音转换技术,通过云端和软硬一体化解决方案,赋能汽车、家电、机器人等领域的人机交互变革。另外,面向企业的“人工智能” “在场景价值落地的最后一英里,科大讯飞正式发布了星火公司智能体平台,并推出了星火商机助手、星火招标助手等典型智能体案例,帮助企业创造价值。


8 国际主流测试集评价第一,讯飞星火 V4.0 总体超越 GPT-4 Turbo


在今年高考真题实测中,讯飞星火语数外各科“成绩”均排名第一,被选为“更能解决问题的大模式”;在科学研究方面,讯飞星火帮助中国科技大学刘海燕教授团队,将蛋白质设计的通过率从 0.1% 提高到 20%,设计所需时间从20%开始 6 个月降至 1 天空;赋予每一个人,帮助一个不懂法律知识的人 70 老人顺利要求退还养老金欠款,协助一位听障人士实现文学梦想。 ······ 星火正在成为我们每一个人的地方。 AI 助手。


自去年 9 月亮全面开放至今,讯飞星火 APP 累计下载量达到安卓公开市场。 1.31 亿,国内工具类通用大模型, App 在写作、编程、工作、学习等方面排名第一,涌现出一批用户喜爱的热门助手。今年" 618 “大促销”,星火大模型加持的智能产品销量同比增长超过 月均使用次数超过70% 4000 万,越来越多的用户开始享受大模型带来的红利。


现场基于国内首个万卡算率集群“飞星一号”,讯飞星火大模型 V4.0 正式发布。讯飞星火 V4.0 七大核心能力全新升级,全面对标 GPT-在文本生成、语言逻辑、知识问答、逻辑判断、数学能力等方面,实现了4Turbo的整体超越。


讯飞星火 V4.0 进一步提升图文识别能力,在科研、金融、医疗、司法、办公等场景中的应用效果已经领先 GPT-4o。另外,星火长文本能力也全新升级,对于长文档知识问答的幻觉问题,行业首发追溯功能。


外部权威测试集还反映了讯飞星火。 V4.0 领先。国内外 12 项目大模型主流检测集中,讯飞星火 8 一个测试集中排名第一,超越 GPT-4 Turbo 等待国际大模型,国内大模型全面领先。


现场,刘庆峰展示了讯飞星火。 V4.0 星火“智力”在指令复杂、逻辑判断复杂、空间推理、高中数学等方面的作用再次演变。以空间推理为例," Bob 在客厅里。在厨房里,他拿着一个水杯。他把球放进杯子里,然后拿着杯子来到卧室。他把杯子倒过来,然后来到花园。他把杯子放在花园里,然后来到车库。问:球在哪里?“基于空间和常识,讯飞星火可以推断出卧室地面上的球。这些能力的提高对未来的智能和家用机器人都有意义。


大模型个性化时代来了!讯飞星火首发“私人空间”,数百万客户一键拥有“ AI “智能全家桶”


大模型不仅给我们的工作和生活带来了便利,还存在着内容相似、内容泛泛、不实用的情况。如何让大模型更好地使用,在工作和生活中形成独特的价值?科大讯飞给出了答案——创造一个更了解你的 AI 助手。


怎样创造懂你的东西 AI 助理?刘庆峰提出,AI 助手应该能够根据用户画像进行个性化表达,基于使用历史进行记忆学习,基于个人信息进行强化学习。在建立客户的个人画像时,可以选择自己的个人风格,也可以根据对话和使用历史动态完善,从而形成个性化的表达风格;AI 结合个人信息,助理可以生成个性化、目的性的内容。


基于此,讯飞星火 APP 以及全新的桌面版升级改版,率先发布“私人空间”。用户可以上传工作、学习、生活、健康等各种信息,形成每个人的专属知识库,然后结合个人设计,让大模型产生更个性化的内容。此外,讯飞星火首批上线 14 一个智能体,为特定场景打造专属助手。


科大讯飞研究院院长刘聪现场演示了“私人空间”的效果。当他上传女儿写的短文,选择符合女儿风格的短文时, AI 人们设置标签后,星火生成了一篇活泼、可爱、更个性化的文章;当他上传了讯飞翻译机的产品海报、客户短视频和相关音频时,星火还可以根据这些多模态信息生成产品培训文档,并可以追溯产生的信息。大型模型进入个性化时代,大型模型工作,学习“可用性”飙升!


另外,星火大模型还打通了全系统讯飞。 C 端软硬件产品生态,数百万智能产品客户一键拥有“星火全家桶”。比如讯飞智能办公本和智能录音笔的文件可以一键同步到星火私人空间。通过数据交换和操作联动,可以将一个办公本中的会议纪要同步到星火中,这样星火就可以写公文或者做。 PPT,并产生待办事项等,带来更加有效的办公体验。


个人数字健康空间来了!讯飞晓医生 APP 下载量超 1200 万


面向专业领域的个性化应用,科大讯飞升级讯飞晓医 APP,发布个人数字健康空间,打造每一个人,每一个家庭 AI 健康助手。


在医疗领域,讯飞星火医疗模式再次升级,医疗核心能力全面超越 GPT-4 Turbo 和 GPT-4o。基于此,讯飞晓医生 APP 各种能力不断升级,覆盖 1600 种常见病、2800 常用药物种类,6000 一种常见的检查检查,可以满足用户看病前、用药时、检查后的核心情景健康需求。目前,讯飞晓医 APP 累计下载量 1200 万,顾客好评 主动推荐率98.8% 42%。


现场刘庆峰介绍,讯飞晓医生 APP 网上的“个人数字健康空间”可以根据用户的个性化信息,如电子病历、检查报告、体检报告等,构建个人数字健康空间。看病前可以进一步分析症状原因,用药时可以判断药物禁忌的性格。检查结束后,可以联合比较给出数据变化,通过角色转换了解其他家庭成员的健康状况。


现在讯飞晓医 APP 多种权威认证已通过数据安全和隐私保护,进一步保障健康数据的安全。在目前医疗资源相对匮乏的情况下,讯飞晓医生 APP 社会对医疗服务的迫切需求得到有效缓解,为个人和家庭健康管理提供了新的途径。


老师最强的帮助!星火智能审阅机减轻了教师批改作业的负担 90%


得益于基础大模型的升级和教育复杂场景的图文识别效果的进一步提高,科大讯飞发布了第一台星火智能审阅机,集智能批改、精准学习、个性化学习于一体。它支持自由排版,不限于纸张大小作业。它不仅支持多学科、多题型的智能批改,还能立即生成多维报告,为教师的作业评论和面对面批准指导提供材料。在现场,刘聪演示了星火智能审批工作的全过程,15 一份学生作业30秒就可以批阅完成,批阅模拟真人字迹,和老师平时批阅作业几乎一样。


有了星火智能审阅机,老师又增加了一台减负提质的机器,因人施教。 AI 原来的助理 90 只需几分钟就可以完成工作,现在只需 5 可以在几分钟内完成;人工分析学习情况 60 现在星火了几分钟 1 可以在几分钟内完成;得益于个性化作业,学生的错题处理率也从 50% 提高到 73%。


在今年的高考评估中,讯飞星火被外界评为“解决问题的大模式”。讯飞星火进一步升级了讯飞。 AI 学习机的 AI 1 对 1 答疑指导功能不仅可以进行多模式启发讲解,自由提问个性化解答,还可以进行互动探究学习、超拟人指导陪伴学习等。,让孩子多了一个“ AI 辅助教师"。


资料表明,与传统的答题视频学习相比,AI 答疑指导的学习方法使孩子的学习完成率提高到一定程度 错题处理率提高到90% 93%的孩子更愿意主动思考,学习效率更高,自信心更强。


发布星火语音大模型 74 一种语言方言“自由对话”,解决了对场景中语音识别难题的强烈影响。


近日,作为第一个完成单位的“多语种智能语音关键技术与产业化”项目,科大讯飞获得国家科技进步奖一等奖。在新闻发布会上,国家获得者再次获得“王炸”,星火语音模型迎来新的突破。


刘庆峰认为,语音将成为万物互联时代人机交互的主要方式。人机交互最重要的场景是远场、噪音、多人说话和多语言。因此,万物互联时代 AIUI(人工智能操作界面)应符合远场高噪音、多语言多方言、双工、多模式等标准。科大讯飞还主导制定双工语音交互。 ISO/IEC 国际标准,并于 2023 年 5 月发布。


面对万物互联时代,星火语音模型发布国际领先的多语种多方言免转换语音识别能力,可以支持 37 个语种、37 “自由对话”的方言。其中,37 一种语言识别效果领先 OpenAI whisper-V3,37 提高个方言识别效果的平均值 30%。现场,科大讯飞展示了讯飞输入法混合方言和外语的语音输入效果,可以大大提高输入效率。


科大讯飞还发布了软硬件一体化的讯飞同声传译系统,可以支持会议同声传译、会议同声传译、展厅同声传译、旅游同声传译等多种场景。本次会议的嘉宾椅子上还配备了讯飞同声传译的听力设备,佩戴后可以实时听取多种语言。 AI 同声翻译。


针对强烈影响场景下的语音识别问题,科大讯飞在多人混合场景中突破了极其复杂的场景语音转写,即使在三人混合场景中也能实现。 86% 语音识别的准确性。三位讯飞研究所的研究人员现场测量了噪音场景,同时混合了演讲。正常人很难听清楚。我看到讯飞星火的多模态能力不仅完成了三人重叠语音的角色分离,还实时转写了大家说的话。爆炸的效果引起了现场不断的掌声。未来基于多模态的声音识别技术,将应用于讯飞听到智能办公、智能屏幕等大会办公产品。


大型模型正在推动人机交互的变革,语音领域的所有应用都值得重构。在模型的加持下,星火汽车智能驾驶舱进行了全新的升级,不仅拥有多语言、多方言的“自由交互”,还拥有多情感、多模式的超拟人交互,让人车交互更加温暖。目前,讯飞语音交互产品国内市场份额稳居第一,并普遍出口到世界各地。星火大模型是一汽、奇瑞、广汽、江准、长城等车企的众多车型,赋予了高度智能的交互体验。


为了让大模型更好地落地,科大讯飞还打造了云端一体化、软硬件一体化的解决方案,赋能家电、运营商、机器人等更多行业场景。面对智能和人形机器人企业的需求,科大讯飞正式发布了机器人超脑平台 行业首次支持多模式交互。现在,400 机器人公司已选择讯飞机器人超脑平台。


星火公司智能体平台正式发布,打造各岗位专属 AI 助手


自去年 5 月 6 日本发布以来,讯飞星火模型正成为国家能源集团、中石油、中国移动、PICC、太平洋保险、交通银行、奇瑞汽车、中国一汽、大众汽车、江汽集团、海尔集团、美的集团等领域龙头企业的首选。


在代码、合规审查、客服、投标、智能交互等诸多典型场景中,讯飞星火已经产生了应用效果。以交通银行为例,基于大型星火模型能力的商品 iFlyCode 覆盖 6000 R&D人员,代码采纳率达到 38%,显著提高了工作效率。


如何更好地解决公司大模型使用的最后一公里问题?刘庆峰提到,公司首先要科学了解大模型能力的边界,根据任务难度选择合适的方案,用更少的计算率和更高的效率打造企业专属的大模型。随着星火 V4.0 他认为,用智能体平台打造每一个岗位的专属助手的时间已经到了。


星火公司智能体平台正式发布。围绕构建智能体的三大关键能力,目前公司智能体平台已覆盖。 400 AI 原子能力,集成 90 外部信源,开放 100 内部 IT 该系统可以根据需求场景快速构建可落地智能体应用。该平台还在生产领域、科技领域、办公领域和管理领域推出。 32 一个企业智能体,供公司即插即用。


科大讯飞以公司智能体平台为基础,打造了星火商机助手、星火投标助手等典型应用案例,为企业应用打下了一个样子。


代码智能体 iFlyCode 其中集成了六大情景智能体,如代码生成助手、架构模式助手、代码问答助手、测试助手、数据库优化助手、代码审核助手等。采用率将由 30% 提升至 52%,大大提高了公司智能体的实用性。


星火商机助手可以实现对商机线索的了解,提高客户访问质量和效率,智能判断营销管理,帮助提高一线营销和商机管理的效率。星火投标助手通过标前寻源、智能投标、校准审批等功能,智能评标结果人机一致率达到 投标异常诊断率超过98%。 80%,在大幅提高公司投标效率的同时降低采购成本。


加速星火开发者生态增长:5 月度开发者增长超过 100 万,总开发者数破 700 万


在帮助开发者生态蓬勃发展的同时,讯飞星火大模型也带来了行业赋能。自今年 1 月 30 日讯飞星火 V3.5 自发布以来,短暂 5 星火开发人员的生态数量在几个月内加速增长,开发人员数量从 598 万增长到 702 万,新增超 104 万;海外开发人员数量超过 40 万;大模型开发者达 57 万。越来越多的开发者正在加入星火生态,释放更多刚需场景的应用价值。


刘庆峰说,中国通用人工智能的伟大未来,只有自主可控的繁荣生态才能实现。面对未来的人工智能新生态,他强调要注重基本的技术生态、智能体生态、应用生态和行业生态,实现自主控制和软硬融合,从而实现大模型的深度落地;我们不仅要科学理性地了解中美在大模型上的综合差距,还要有信心快速追求,给出一整套从源头技术到工业生态再到应用落地的打法,用长期主义打造真正的自主性和可控性 AI 产业生态。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com