DeepSeek开源周才第二天，有些公司已经不再淡定。

2025-02-27

兄弟们，走过路不要错过，今天的兄弟们， AI 圈子算得上是特别热闹的。

真正 " Open " 的 DeepSeek ，打开开源周的第二发炮弹，短短几个小时就已经在了。 GitHub 上，获得了 3k 多星。

" 开源老兵 " 阿里通义千问也没有闲着，推出了 QwQ-Max-Preview 深入思考模型，展示思维链，也支持网络搜索。

凌晨两点多，每个人都可能还在做梦，大洋彼岸。 Anthropic 还更新了模型。声称他们到目前为止最聪明的 Claude 3.7 Sonnet ，还是推理模型和传统模型？ " 混血 " 。

估计今天那些专门做模型评价的博主，都快太忙了。。

加上 Grok 3 、 DeepSeek R1 、 o3 mini ，世超猜测今年的推理模式一定要有一战，可没想到，来得这么快。

光是这么说大家大概也没有感觉到，今天我们就一个个来看看， AI 究竟是怎样一种热闹的圈子。

首先，把目光放在新一代， " 开源战将 " DeepSeek 身上。

用 R1 在对市场进行一次教育后， DeepSeek 在过去的两天里，一个完整的开源， 5 每天发送一个代码库的时间。

第一天，整整一个 FlashMLA ，这个东西是专门针对英伟达的。 Hoppers GPU （例如 H100 、 H800 ），进行效率提升，通俗地说就是提高效率，榨干 GPU 最后一滴性能。

今日开源，则是 DeepEP 通讯库。

据官方介绍，这是专门为专家混合而设计的。（ MoE ）和专家并行（ EP ）设计的通讯库。太复杂了我们也不细说，大白话就是通讯库可以让通讯库变得更复杂。 " 专家们 " 沟通速度更快，效率更高。

盲目猜测一波，国内那些手上有手的人 Hoppers GPU ，还是研究 MOE 模型 AI 公司，也许已经冲了。

不清楚明日 DeepSeek 又会开源哪个代码库，但是光凭他们这种开放、真诚的态度，吸粉就是分分钟的事，在这里， DeepSeek 在评论区下面，世超已经看到了不止一个哥哥，面对着他。 OpenAI 贴脸放大。

但是说到这里，也许会有差友疑惑，网上整天大喊大叫开源，这跟我们到底有什么关系？

这么说吧， DeepSeek R1 开源后，各种规模的民营企业和国有企业都接吻了，大学甚至政府部门都没有接入。 DeepSeek ，就是在进入的路上。

经过大规模模型部署，下一步就是建立生态，整合行业，就像当年的模型一样。 " 互联网 " ， AI 同样也能成为基础设施，融入到我们生活的方方面面。

很难说，闭源模型正在构建生态这一步，可以不在短时间内达到类似的效果 DeepSeek 这种效果。

所以这一切，我们也许都要感谢开源。

让我们来看看阿里通义千问。 QwQ-Max-Preview ，这是一种推理模式。在国内，阿里也算是第一家推出推理模型的头部大厂。

按照官方的说法，这是一个基础。 Qwen2.5-Max 推理模型，具有很强的数学理解、编码能力，但目前还只是预览版。

世超在第一时间简单尝试了一下， QwQ 还展示了思维链。(必须说，QwQ 这个名字有点可爱。)

问到一个真正的数学竞赛问题，最后的答案是对的，就是思考时间稍长一点，我粗略估计思考需要两分钟出头。

这题问 DeepSeek R1 ，它的思考过程跟随 QwQ 非常相似，也是对多种概率的分析， R1 胜利在于推理速度稍快一些。（ 112 秒）。

同样的话题，我今天又问了另一个主角。 Claude 3.7 Sonnet 。

只能说，又快又准。

但是值得注意的是， Claude 3.7 Sonnet 这是一种混合模式，一种模式有标准模式和扩展模式。

要想看到大模型的推理步骤，思考过程，就必须选择扩展模式。

就像每个人看到的，感觉 Claude 3.7 Sonnet 推理能力，就是另外的价格。

世超还找到了几个外网的实测案例，发现 Claude 的代码能力依然强得可怕。

喂给同一组提示词 Claude 3.7 Sonnet 和 Grok 3 ，这是 Claude 3.7 Sonnet 的结果。

再来看 Grok 3 是的，直接被碾压。

即便 DeepSeek 加入战斗，也是秒。。

总而言之，看下来， AI 到目前为止，已经有点超乎世超的想象了。

尽管今天这三条新闻放在一起，打孔一看，似乎没有什么特别的联系。

但是稍微提炼一下你就会发现，它们正好反映了当前人工智能的发展趋势：开放源码阵营日益壮大，推理模式成为主流。

开源与闭源之争，模型， DeepSeek 即使是奥特曼一出手，也要亲自承认， OpenAI 的闭源策略 " 站在历史错误的一边 " 。

像 Llama 家族这一具有里程碑意义的模型，对开源社区的重要性不必多说。

而除了 DeepSeek 和 Meta ，阿里通义千问， xAI ，也有百度陆续拥抱开源， Minimax 和阶跃星辰，肉眼可见开源阵营正在壮大。

另一方面，在过去的几年里，大模型是否总是强调自己的长文本能力，慢慢开始多模式，如卷文图片、文学视频、语音交互等。最近，模型的分数都是数学和代码。

真的回答了那句话， AI 一天，人间一年。

照这样下去，也许有一天， OpenAI 宣布开源，或是哪一个突然宣布？ AGI 整个出来，我都不会感到惊讶。

发文：西西

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

谈谈现在的RTX 50系游戏本全面延迟，该不该继续等待？

DeepSeek带飞万元AI女友：单身汪福音，出生率躺枪。

侯毅下注的宠物鲜食，真的有市场吗？

网易仍然没有走出低谷

在实体零售线上，究竟要不要“爆改”？

项目推荐

康小虎百岁计划・健康大使招募计划

康老板 · 氧疗堂