月暗与DeepSeek的“听牌”博弈:技术理想与商业现实的对垒

4分钟前
“既生瑜,何生亮?”

2023年初,若问“谁是中国最具技术理想的人”,十位投资人中约半数会指向“Kimi(杨植麟)”。


彼时,杨植麟创立的月之暗面(简称“月暗”)如他本人般神秘且特立独行。当国内大模型陷入“参数竞赛”时,成立仅半年的月暗召开首场发布会,聚焦“长文本”领域,剑指C端超级应用。


月暗与DeepSeek的首次交锋发生在2025年春节前夕。同一天,相隔不足两小时,DeepSeek发布R1,月暗推出Kimi k1.5。尽管训练思路相近,但DeepSeek-R1凭借模型放量、性能优势及开源策略,迅速风靡全球。


R1的爆火让世界开始关注其背后的梁文锋。《暗涌》2023年的一篇报道被翻出,文中梁文锋提及“研究”“探索”“不求商业回报”等理念,“中国最有技术理想”的标签由此转移到他身上。


早期投资人总结,月暗与DeepSeek的共性在于:灵魂人物引领、一流技术团队支撑、鼓励创新的文化氛围。


不久前,月暗抢先发布并开源新模型K2.6,“截胡”了DeepSeek的V4。



紧接着,DeepSeek寻求融资的消息传出,腾讯与阿里巴巴正洽谈投资,而这两家也是月暗的股东。


据知情人士透露,DeepSeek将月暗作为部分估值参照。目前月暗估值达180亿美元,正筹备上市;DeepSeek的目标估值已从最初的至少100亿美元上调至超200亿美元,反超月暗。


牌局未终,筹码尚温。月暗与DeepSeek的故事恰似麻将桌上的高手过招——彼此紧盯对方牌路,却按各自策略出牌。


麻将的魅力正在于:不到最后一张牌翻开,无人知晓谁会“点炮”,谁能“自摸”。


“登月”背后的转折


去年底,杨植麟对内表示公司发展健康、资金充足,不急于上市。


仅三个月后,局势逆转——月暗被曝“考虑赴港IPO”。


这一转变早有端倪:据光子星球了解,去年月暗内部弥漫焦虑。一方面,智谱、MiniMax接连上市,员工因大模型窗口期短暂、上市机会易逝而士气低落;另一方面,商业化遇阻——月暗虽手握一流资金与人才,核心产品却仅有Kimi助手,收入来源单一,免费用户占比高,付费转化率低,API调用量远不及B端专注型公司。


业内人士称,月暗因误判卷入与大厂的竞争,国内未敌豆包,又错失海外市场开拓时机。


“海外市场竞争充分,除GPT和Gemini外,若全球客户愿为国产大模型买单,仍有广阔空间。打开市场后,大模型与应用研发才能形成正向循环。”该人士指出,目前AI视频领域出海成效显著,部分创业公司虽体量小,却能与大厂抗衡。


DeepSeek R1给行业(包括月暗)敲响警钟。


技术战略上,月暗聚焦Agent方向——该赛道所需的长上下文记忆、任务拆解规划、底层模型推理能力,与其技术储备高度契合。


按杨植麟的说法,Kimi K2.5后的进化逻辑围绕Token效率、长上下文、智能体集群三个维度协同推进。他判断,智能发展将从单智能体向动态集群进化,这为K2.6埋下伏笔。


尽管Kimi助手仍可免费使用,但对高价值用户的筛选已十分明显。不少用户反映,未充值会员时,Kimi使用速度变慢,常遇高峰算力不足问题——这正是月暗的策略:在算力有限的情况下,瞄准能带来付费转化的生产力用户。


该策略加速了Kimi商业化闭环。早期,Kimi未完全开放收费,仅推出打赏功能(本质是高峰期优先使用权,属流量调节手段,非产品分层)。


去年9月,“OK Computer”功能推出后,转为49元、99元、199元/月三档会员,将深度研究、K2 Turbo、长思考等能力打包,初步尝试按能力付费。


如今,会员订阅进一步细分为四档,价格带大幅延伸,最高档近700元/月,远超此前199元上限,新增高阶权益明确指向专业用户与企业场景。



其定价逻辑不再基于“能否使用”,而是“用户能调动多少Agent、访问什么级别数据库、获得多少并行能力”。这标志着Kimi彻底放弃与豆包等C端产品的流量竞争,转而深耕专业生产力市场,试图从高价值用户付费中获取可持续收入。


K2.6:从“信息容器”到“执行引擎”的分水岭


总体而言,K2.6的更新更侧重于增强Agent的“动手”能力,而非“大脑”智力。



K2.6在搜索型Agent、长链路编码、工具协作等需执行与检索的任务上,已与GPT-5.4、Claude Opus 4.6处于同一水平线;但在纯推理、纯数学等依赖内部思维链与抽象逻辑的任务上,仍有差距。


技术报告展示了K2.6的三项核心能力:一是长程编码能力,可连续编码13小时,编写或修改超4000行代码,堪称“编码劳模”。官方实测中,用冷门Zig语言重构AI模型推理,速度从15 tokens/s提升至193 tokens/s,体现“以执行代推理”的优势;二是Agent集群能力,支持调动300个子Agent并行工作,完成4000个协作步骤,任务完成度与交付质量较上一代提升;三是自主执行能力,模型能在OpenClaw等主动式Agent框架中持续自主运行5天,可作为7x24小时的后台“数字员工”处理复杂任务。


此次K2.6标志着月暗的重大战略转向:从“信息容器”彻底转为“执行引擎”,从追求对话智能全面押注于能直接交付结果的Agentic智能。


回顾Kimi的升级历程,可分为三个阶段:早期聚焦超长文本与对话,如知识渊博的图书管理员,负责理解、检索、总结信息,不改变外部世界,仅提升用户信息获取效率;K2、K2.5时期,核心增强代码生成、数学推理、复杂指令遵循等能力,模型从“读”走向“算”,像聪明的实习生,能写可运行代码但需用户检查部署,开始具备工作记忆与链式思考能力;K2.6阶段,走向多Agent协同执行,将复杂任务拆解为子任务,调度不同“技能Agent”并行执行后整合成果,从“一个大脑”变成“项目经理+数字员工团队”。


智能带来的生产力提升推动月暗商业模式转变——从功能收费转为按执行任务、成果交付收费。对月暗而言,K2.6的商业价值高于技术价值,是其从“信息容器”迈向“执行引擎”的拐点,也是Agent能承担复杂工作的量产证明。


月暗官方开篇引用Linux之父的名言“Talk is cheap. Show me the code”,或许还应补上“Only results matter.”(唯结果论)。


V4狭路相逢:两种Agent路线的碰撞


“狼来了”的故事终有结局——DeepSeek-V4预览版在K2.6之后姗姗来迟。


据官方信息,V4更新核心是“普惠”:通过技术创新,让顶尖Agent能力、百万级超长上下文、极致推理性能以更低成本被个人与企业便捷使用。


V4在成本效率上做了极致优化:采用MoE架构,总参数达1.6万亿,每次推理仅激活约490亿参数,兼顾性能与成本;上下文窗口从128K扩展至100万Token,提升近10倍,且100万Token长度下信息召回率达97%。


V4最具冲击力的或许不是技术参数,而是对闭源巨头商业模式的挑战。


DeepSeek-V4采取双版本定价:面向个人开发者的V4-Flash,每百万tokens输入0.2元、输出2元;V4-Pro每百万tokens输入1元、输出12元。粗略估算,其价格约为OpenAI和Anthropic旗舰模型的1/16至1/25。


DeepSeek表示,受高端算力限制,目前Pro服务吞吐有限,预计下半年昇腾950超节点批量上市后,Pro价格将大幅下调。


关键在于,V4-Pro并非廉价替代品:其在Agentic Coding评测中获开源最佳,使用体验优于Sonnet 4.5,交付质量接近Claude Opus 4.6的非思考模式。


同样聚焦Agent,DeepSeek V4与Kimi K2.6的本质区别在于优化视角:前者是“微观智能驱动力”,后者是“宏观集群执行力”。


DeepSeek的内在哲学是“模型即Agent”,侧重“单兵为王”——通过提升模型自身智能与效率,最大化单个Agent能力。V4假设单个模型能力达天花板,基于其构建的Agent自然最强,用户无需复杂集群调度,一个Agent即可完成多数任务。


Kimi K2.6则更偏向“Agent即系统”,将Agent拧成“一股绳”,核心能力源于多Agent Swarm集群的协同。K2.6认为,复杂任务靠单个Agent串行完成太慢且易出错,不如拆分为数百小任务,让上百Agent并行处理后汇总——即便单个Agent智商非顶尖,团队协作效率也远超单兵。


两种路线并非对立,而是互补:前者拼“智商”(深度),后者拼“协作”(广度)。理想的Agent系统可将DeepSeek V4作为子Agent的“大脑”,再用Kimi的集群框架组织子Agent。


种种迹象表明,DeepSeek正向资本与商业化靠拢,且不可避免地将月暗卷入风暴。



智谱与MiniMax已上市,从团队基因、技术能力、融资能力等综合考量,月暗成为DeepSeek锚定估值的最佳标的。


目前,月暗的核心叙事是“长上下文本+Agent集群智能”,支撑起180亿美元估值。DeepSeek以超200亿美元目标估值参照月暗,直接挑战其估值合理性。


投资者天然会进行同类比较,更何况月暗与DeepSeek本就相似。当月暗从“唯一选择”变为“可替代选项”,估值逻辑便从“稀缺性溢价”切换为“可替代性折价”。


DeepSeek这局牌打得极凶:技术“一把梭哈”,定价直接“截胡”,估值有望反超月暗。


但其软肋也很明显:开源是双刃剑,易“养大对手饿死自己”;长期以AI实验室自居、以研究为导向,无法保证更新频率稳定(V3发布于2024年12月,V4频频跳票);因坚持开源,难以通过模型授权收费,收入仅靠微薄的API调用费,商业模式未建立,仍需承担算力、人才争夺、基建建设等高昂成本。


月暗虽被“截胡”,却握有几张“暗牌”:Agent集群的工程成熟度、垂直行业深耕、初步见效的Agent商业模式——这些是DeepSeek短期难以超越的。


谁能“自摸”,不靠“嗓门大”,而看谁能在商业化牌桌上将技术真正转化为“筹码”。


DeepSeek摸到了“听牌”资格,月暗也有“改听”机会。只是这张牌桌,从此再无“轻松牌”可打。


本文来自微信公众号“guangzi0088”(ID:TMTweb),作者:郝鑫,编辑:吴先之,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com