傲视群雄,阿里通义千问 Qwen2-72B 成“王者”

2024-06-29

IT 世家 6 月 28 日消息,Hugging Face 联合创始人兼首席执行执行人 Clem Delangue 于 6 月 26 日在 X 平台发表文章,通义千问表示阿里云开源。(Qwen)指令微调模型 Qwen2-72B 在开源模型排行榜上名列前茅。


Hugging Face 全新的开源大语言模型排行榜已经公布,通过 300 片英伟达 H100 GPU,再次运行 MMLU-pro 对当前主流的大语言模型进行标准评价,并在其要点介绍中表示。 Qwen2-72B 为了“王者”,并表示中国众多开源模式在名单上占有一席之地。


为提供全新的开源大模型排名,他指出, 300 块 H100 对当前全球 100 Qwen2等多种主流开源模式、Llama-3、mixtral、Phi-3 等,在 BBH、MUSR、MMLU-PRO、GPQA 等待基准测试集进行新的评估。


阿里巴巴开源 Qwen-2 72B 模型在激烈的竞争中脱颖而出,不仅超越了科技巨头 Meta 的 Llama-三是超越了法国著名的大型模型平台 Mistralai 的 Mixtral,成为新的行业领导者。IT 世家援引官方博文附加名单如下:


排在新的排行榜上


Qwen/Qwen2-72BB-Instruct2meta-llama/Meta-Llama-3-70B-Instruct3microsoft/Phi-3-medium-4k-instruct44k01-ai/Yi-1.5-34B-Chat5CohereForAI/c4ai-command-r-plus6abacusai/Smaug-72B-v0.1Qwen/Qwen17.110B8Qwen/Qwen110.5-110B-Chat9microsoft/Phi-3-small-128k-instruct1001-ai/Yi-1.5-9B-Chat


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com