月暗与DeepSeek的“听牌”博弈：技术理想与商业现实的对垒

04-25 06:48

“既生瑜，何生亮？”

2023年初，若问“谁是中国最具技术理想的人”，十位投资人中约半数会指向“Kimi（杨植麟）”。

彼时，杨植麟创立的月之暗面（简称“月暗”）如他本人般神秘且特立独行。当国内大模型陷入“参数竞赛”时，成立仅半年的月暗召开首场发布会，聚焦“长文本”领域，剑指C端超级应用。

月暗与DeepSeek的首次交锋发生在2025年春节前夕。同一天，相隔不足两小时，DeepSeek发布R1，月暗推出Kimi k1.5。尽管训练思路相近，但DeepSeek-R1凭借模型放量、性能优势及开源策略，迅速风靡全球。

R1的爆火让世界开始关注其背后的梁文锋。《暗涌》2023年的一篇报道被翻出，文中梁文锋提及“研究”“探索”“不求商业回报”等理念，“中国最有技术理想”的标签由此转移到他身上。

早期投资人总结，月暗与DeepSeek的共性在于：灵魂人物引领、一流技术团队支撑、鼓励创新的文化氛围。

不久前，月暗抢先发布并开源新模型K2.6，“截胡”了DeepSeek的V4。

紧接着，DeepSeek寻求融资的消息传出，腾讯与阿里巴巴正洽谈投资，而这两家也是月暗的股东。

据知情人士透露，DeepSeek将月暗作为部分估值参照。目前月暗估值达180亿美元，正筹备上市；DeepSeek的目标估值已从最初的至少100亿美元上调至超200亿美元，反超月暗。

牌局未终，筹码尚温。月暗与DeepSeek的故事恰似麻将桌上的高手过招——彼此紧盯对方牌路，却按各自策略出牌。

麻将的魅力正在于：不到最后一张牌翻开，无人知晓谁会“点炮”，谁能“自摸”。

“登月”背后的转折

去年底，杨植麟对内表示公司发展健康、资金充足，不急于上市。

仅三个月后，局势逆转——月暗被曝“考虑赴港IPO”。

这一转变早有端倪：据光子星球了解，去年月暗内部弥漫焦虑。一方面，智谱、MiniMax接连上市，员工因大模型窗口期短暂、上市机会易逝而士气低落；另一方面，商业化遇阻——月暗虽手握一流资金与人才，核心产品却仅有Kimi助手，收入来源单一，免费用户占比高，付费转化率低，API调用量远不及B端专注型公司。

业内人士称，月暗因误判卷入与大厂的竞争，国内未敌豆包，又错失海外市场开拓时机。

“海外市场竞争充分，除GPT和Gemini外，若全球客户愿为国产大模型买单，仍有广阔空间。打开市场后，大模型与应用研发才能形成正向循环。”该人士指出，目前AI视频领域出海成效显著，部分创业公司虽体量小，却能与大厂抗衡。

DeepSeek R1给行业（包括月暗）敲响警钟。

技术战略上，月暗聚焦Agent方向——该赛道所需的长上下文记忆、任务拆解规划、底层模型推理能力，与其技术储备高度契合。

按杨植麟的说法，Kimi K2.5后的进化逻辑围绕Token效率、长上下文、智能体集群三个维度协同推进。他判断，智能发展将从单智能体向动态集群进化，这为K2.6埋下伏笔。

尽管Kimi助手仍可免费使用，但对高价值用户的筛选已十分明显。不少用户反映，未充值会员时，Kimi使用速度变慢，常遇高峰算力不足问题——这正是月暗的策略：在算力有限的情况下，瞄准能带来付费转化的生产力用户。

该策略加速了Kimi商业化闭环。早期，Kimi未完全开放收费，仅推出打赏功能（本质是高峰期优先使用权，属流量调节手段，非产品分层）。

去年9月，“OK Computer”功能推出后，转为49元、99元、199元/月三档会员，将深度研究、K2 Turbo、长思考等能力打包，初步尝试按能力付费。

如今，会员订阅进一步细分为四档，价格带大幅延伸，最高档近700元/月，远超此前199元上限，新增高阶权益明确指向专业用户与企业场景。

其定价逻辑不再基于“能否使用”，而是“用户能调动多少Agent、访问什么级别数据库、获得多少并行能力”。这标志着Kimi彻底放弃与豆包等C端产品的流量竞争，转而深耕专业生产力市场，试图从高价值用户付费中获取可持续收入。

K2.6：从“信息容器”到“执行引擎”的分水岭

总体而言，K2.6的更新更侧重于增强Agent的“动手”能力，而非“大脑”智力。

K2.6在搜索型Agent、长链路编码、工具协作等需执行与检索的任务上，已与GPT-5.4、Claude Opus 4.6处于同一水平线；但在纯推理、纯数学等依赖内部思维链与抽象逻辑的任务上，仍有差距。

技术报告展示了K2.6的三项核心能力：一是长程编码能力，可连续编码13小时，编写或修改超4000行代码，堪称“编码劳模”。官方实测中，用冷门Zig语言重构AI模型推理，速度从15 tokens/s提升至193 tokens/s，体现“以执行代推理”的优势；二是Agent集群能力，支持调动300个子Agent并行工作，完成4000个协作步骤，任务完成度与交付质量较上一代提升；三是自主执行能力，模型能在OpenClaw等主动式Agent框架中持续自主运行5天，可作为7x24小时的后台“数字员工”处理复杂任务。

此次K2.6标志着月暗的重大战略转向：从“信息容器”彻底转为“执行引擎”，从追求对话智能全面押注于能直接交付结果的Agentic智能。

回顾Kimi的升级历程，可分为三个阶段：早期聚焦超长文本与对话，如知识渊博的图书管理员，负责理解、检索、总结信息，不改变外部世界，仅提升用户信息获取效率；K2、K2.5时期，核心增强代码生成、数学推理、复杂指令遵循等能力，模型从“读”走向“算”，像聪明的实习生，能写可运行代码但需用户检查部署，开始具备工作记忆与链式思考能力；K2.6阶段，走向多Agent协同执行，将复杂任务拆解为子任务，调度不同“技能Agent”并行执行后整合成果，从“一个大脑”变成“项目经理+数字员工团队”。

智能带来的生产力提升推动月暗商业模式转变——从功能收费转为按执行任务、成果交付收费。对月暗而言，K2.6的商业价值高于技术价值，是其从“信息容器”迈向“执行引擎”的拐点，也是Agent能承担复杂工作的量产证明。

月暗官方开篇引用Linux之父的名言“Talk is cheap. Show me the code”，或许还应补上“Only results matter.”（唯结果论）。

V4狭路相逢：两种Agent路线的碰撞

“狼来了”的故事终有结局——DeepSeek-V4预览版在K2.6之后姗姗来迟。

据官方信息，V4更新核心是“普惠”：通过技术创新，让顶尖Agent能力、百万级超长上下文、极致推理性能以更低成本被个人与企业便捷使用。

V4在成本效率上做了极致优化：采用MoE架构，总参数达1.6万亿，每次推理仅激活约490亿参数，兼顾性能与成本；上下文窗口从128K扩展至100万Token，提升近10倍，且100万Token长度下信息召回率达97%。

V4最具冲击力的或许不是技术参数，而是对闭源巨头商业模式的挑战。

DeepSeek-V4采取双版本定价：面向个人开发者的V4-Flash，每百万tokens输入0.2元、输出2元；V4-Pro每百万tokens输入1元、输出12元。粗略估算，其价格约为OpenAI和Anthropic旗舰模型的1/16至1/25。

DeepSeek表示，受高端算力限制，目前Pro服务吞吐有限，预计下半年昇腾950超节点批量上市后，Pro价格将大幅下调。

关键在于，V4-Pro并非廉价替代品：其在Agentic Coding评测中获开源最佳，使用体验优于Sonnet 4.5，交付质量接近Claude Opus 4.6的非思考模式。

同样聚焦Agent，DeepSeek V4与Kimi K2.6的本质区别在于优化视角：前者是“微观智能驱动力”，后者是“宏观集群执行力”。

DeepSeek的内在哲学是“模型即Agent”，侧重“单兵为王”——通过提升模型自身智能与效率，最大化单个Agent能力。V4假设单个模型能力达天花板，基于其构建的Agent自然最强，用户无需复杂集群调度，一个Agent即可完成多数任务。

Kimi K2.6则更偏向“Agent即系统”，将Agent拧成“一股绳”，核心能力源于多Agent Swarm集群的协同。K2.6认为，复杂任务靠单个Agent串行完成太慢且易出错，不如拆分为数百小任务，让上百Agent并行处理后汇总——即便单个Agent智商非顶尖，团队协作效率也远超单兵。

两种路线并非对立，而是互补：前者拼“智商”（深度），后者拼“协作”（广度）。理想的Agent系统可将DeepSeek V4作为子Agent的“大脑”，再用Kimi的集群框架组织子Agent。

种种迹象表明，DeepSeek正向资本与商业化靠拢，且不可避免地将月暗卷入风暴。

智谱与MiniMax已上市，从团队基因、技术能力、融资能力等综合考量，月暗成为DeepSeek锚定估值的最佳标的。

目前，月暗的核心叙事是“长上下文本+Agent集群智能”，支撑起180亿美元估值。DeepSeek以超200亿美元目标估值参照月暗，直接挑战其估值合理性。

投资者天然会进行同类比较，更何况月暗与DeepSeek本就相似。当月暗从“唯一选择”变为“可替代选项”，估值逻辑便从“稀缺性溢价”切换为“可替代性折价”。

DeepSeek这局牌打得极凶：技术“一把梭哈”，定价直接“截胡”，估值有望反超月暗。

但其软肋也很明显：开源是双刃剑，易“养大对手饿死自己”；长期以AI实验室自居、以研究为导向，无法保证更新频率稳定（V3发布于2024年12月，V4频频跳票）；因坚持开源，难以通过模型授权收费，收入仅靠微薄的API调用费，商业模式未建立，仍需承担算力、人才争夺、基建建设等高昂成本。

月暗虽被“截胡”，却握有几张“暗牌”：Agent集群的工程成熟度、垂直行业深耕、初步见效的Agent商业模式——这些是DeepSeek短期难以超越的。

谁能“自摸”，不靠“嗓门大”，而看谁能在商业化牌桌上将技术真正转化为“筹码”。

DeepSeek摸到了“听牌”资格，月暗也有“改听”机会。只是这张牌桌，从此再无“轻松牌”可打。

本文来自微信公众号“guangzi0088”（ID：TMTweb），作者：郝鑫，编辑：吴先之，36氪经授权发布。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

30省份人口数据透视：增长与减少背后的区域发展逻辑

利润下滑、门店收缩，太平鸟的转型困局与破局之路

黄仁勋称其为“灾难”：DeepSeek在华为芯片上成功运行

48元一杯的阿嬷手作新品引热议：高价背后是价值支撑还是市场勇气？

“雪山救狐狸”爆火背后：从酱板鸭梗到AI视频的狂欢与隐忧

项目推荐

AI云印侠

幸福绩效

企业数字化人才孵化系统