腾讯混元2.0重磅发布:推理性能与效率跻身业界前列
快科技12月6日消息,腾讯自主研发的大模型混元2.0(Tencent HY 2.0)正式亮相,与此同时,DeepSeek V3.2也正逐步融入腾讯生态体系。
目前,这两大模型已率先在元宝、ima等腾讯AI原生应用中上线运行,腾讯云也已开放相关模型的API接口及平台服务。
全新推出的Tencent HY 2.0采用混合专家(MoE)架构,总参数量高达4060亿(激活参数320亿),支持256K超长上下文窗口,推理能力与效率处于业界领先水平。

相较于上一版本(Hunyuan-T1-20250822),HY 2.0 Think在预训练数据和强化学习策略上均有显著优化,在数学、科学、代码、指令遵循等复杂推理场景的综合表现稳居国内第一梯队,泛化能力大幅提升。
数学科学知识推理方面:通过高质量数据开展Large Rollout强化学习,使HY 2.0 Think的推理能力显著增强,在国际数学奥林匹克竞赛(IMO-AnswerBench)和哈佛MIT数学竞赛(HMMT2025)等权威测试中取得优异成绩。依托预训练数据的改进,模型在极度考验知识储备的Humanity’s Last Exam(HLE)和侧重泛化性的ARC AGI等任务中也实现了大幅进步。

指令遵循与长文多轮交互能力:借助重要性采样修正缓解训练与推理的不一致问题,实现长窗口RL的高效稳定训练。同时,通过多样化可验证的任务沙盒及基于打分准则的强化学习,显著提升了HY 2.0 Think在Multi Challenge等指令遵循和多轮任务中的表现。
代码与智能体能力:构建规模化可验证环境及高质量合成数据,极大增强了模型在Agentic Coding及复杂工具调用场景下的落地能力,在SWE-bench Verified及Tau2-Bench等面向真实应用场景的智能体任务中实现了性能跃升。

基于RLVR+RLHF双阶段强化学习策略,HY 2.0的输出“质感”明显提升,在文本创作、前端开发、指令遵循等实用场景中展现出差异化优势。
在文学创作领域,HY 2.0有效降低了“AI痕迹”,能够敏锐捕捉指令中的潜在情感需求,输出观点深刻、逻辑严谨的文章。
Tencent HY 2.0模型具备扎实的代码能力和一定的“视觉审美”,在生成Web小游戏时,不仅能顺畅运行复杂的JS逻辑,还能输出符合审美标准的CSS布局与动画效果。

本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




