DeepSeek开源周才第二天,有些公司已经不再淡定。
兄弟们,走过路不要错过,今天的兄弟们, AI 圈子算得上是特别热闹的。
真正 " Open " 的 DeepSeek ,打开开源周的第二发炮弹,短短几个小时就已经在了。 GitHub 上,获得了 3k 多星。
" 开源老兵 " 阿里通义千问也没有闲着,推出了 QwQ-Max-Preview 深入思考模型,展示思维链,也支持网络搜索。
凌晨两点多,每个人都可能还在做梦,大洋彼岸。 Anthropic 还更新了模型。声称他们到目前为止最聪明的 Claude 3.7 Sonnet ,还是推理模型和传统模型? " 混血 " 。
估计今天那些专门做模型评价的博主,都快太忙了。。
加上 Grok 3 、 DeepSeek R1 、 o3 mini ,世超猜测今年的推理模式一定要有一战,可没想到,来得这么快。
光是这么说大家大概也没有感觉到,今天我们就一个个来看看, AI 究竟是怎样一种热闹的圈子。
首先,把目光放在新一代, " 开源战将 " DeepSeek 身上。
用 R1 在对市场进行一次教育后, DeepSeek 在过去的两天里,一个完整的开源, 5 每天发送一个代码库的时间。
第一天,整整一个 FlashMLA ,这个东西是专门针对英伟达的。 Hoppers GPU ( 例如 H100 、 H800 ),进行效率提升,通俗地说就是提高效率,榨干 GPU 最后一滴性能。
今日开源,则是 DeepEP 通讯库。
据官方介绍,这是专门为专家混合而设计的。( MoE )和专家并行( EP )设计的通讯库。太复杂了我们也不细说,大白话就是通讯库可以让通讯库变得更复杂。 " 专家们 " 沟通速度更快,效率更高。
盲目猜测一波,国内那些手上有手的人 Hoppers GPU ,还是研究 MOE 模型 AI 公司,也许已经冲了。
不清楚明日 DeepSeek 又会开源哪个代码库,但是光凭他们这种开放、真诚的态度,吸粉就是分分钟的事,在这里, DeepSeek 在评论区下面,世超已经看到了不止一个哥哥,面对着他。 OpenAI 贴脸放大。
但是说到这里,也许会有差友疑惑,网上整天大喊大叫开源,这跟我们到底有什么关系?
这么说吧, DeepSeek R1 开源后,各种规模的民营企业和国有企业都接吻了,大学甚至政府部门都没有接入。 DeepSeek ,就是在进入的路上。
经过大规模模型部署,下一步就是建立生态,整合行业,就像当年的模型一样。 " 互联网 " , AI 同样也能成为基础设施,融入到我们生活的方方面面。
很难说,闭源模型正在构建生态这一步,可以不在短时间内达到类似的效果 DeepSeek 这种效果。
所以这一切,我们也许都要感谢开源。
让我们来看看阿里通义千问。 QwQ-Max-Preview ,这是一种推理模式。在国内,阿里也算是第一家推出推理模型的头部大厂。
按照官方的说法,这是一个基础。 Qwen2.5-Max 推理模型,具有很强的数学理解、编码能力,但目前还只是预览版。
世超在第一时间简单尝试了一下, QwQ 还展示了思维链。(必须说,QwQ 这个名字有点可爱。)
问到一个真正的数学竞赛问题,最后的答案是对的,就是思考时间稍长一点,我粗略估计思考需要两分钟出头。
这题问 DeepSeek R1 ,它的思考过程跟随 QwQ 非常相似,也是对多种概率的分析, R1 胜利在于推理速度稍快一些。( 112 秒 )。
同样的话题,我今天又问了另一个主角。 Claude 3.7 Sonnet 。
只能说,又快又准。
但是值得注意的是, Claude 3.7 Sonnet 这是一种混合模式,一种模式有标准模式和扩展模式。
要想看到大模型的推理步骤,思考过程,就必须选择扩展模式。
就像每个人看到的,感觉 Claude 3.7 Sonnet 推理能力,就是另外的价格。
世超还找到了几个外网的实测案例,发现 Claude 的代码能力依然强得可怕。
喂给同一组提示词 Claude 3.7 Sonnet 和 Grok 3 ,这是 Claude 3.7 Sonnet 的结果。
再来看 Grok 3 是的,直接被碾压。
即便 DeepSeek 加入战斗,也是秒。。
总而言之,看下来, AI 到目前为止,已经有点超乎世超的想象了。
尽管今天这三条新闻放在一起,打孔一看,似乎没有什么特别的联系。
但是稍微提炼一下你就会发现,它们正好反映了当前人工智能的发展趋势:开放源码阵营日益壮大,推理模式成为主流。
开源与闭源之争,模型, DeepSeek 即使是奥特曼一出手,也要亲自承认, OpenAI 的闭源策略 " 站在历史错误的一边 " 。
像 Llama 家族这一具有里程碑意义的模型,对开源社区的重要性不必多说。
而除了 DeepSeek 和 Meta ,阿里通义千问, xAI ,也有百度陆续拥抱开源, Minimax 和阶跃星辰,肉眼可见开源阵营正在壮大。
另一方面,在过去的几年里,大模型是否总是强调自己的长文本能力,慢慢开始多模式,如卷文图片、文学视频、语音交互等。最近,模型的分数都是数学和代码。
真的回答了那句话, AI 一天,人间一年。
照这样下去,也许有一天, OpenAI 宣布开源,或是哪一个突然宣布? AGI 整个出来,我都不会感到惊讶。
发文:西西
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




