AI激战正酣,业界翘首梁文锋

梁文锋
作者/冯雨晨
当下,各方巨头已在AI赛道集结完毕。
互联网大厂纷纷入局,野心尽显:都想让自家AI大模型应用成为流量入口的霸主。而在AI大模型的赛场上,曾有一位核心人物备受瞩目。
去年此时,正是他声名鹊起之时。回溯至2025年春节前一周,梁文锋带领DeepSeek推出推理大模型R1,以出人意料的低成本,打造出能与全球顶尖模型抗衡的性能,东方的技术力量就此震撼全球科技领域。
这位出生于广东湛江的85后,极少公开露面,身家已超百亿,其创立的DeepSeek在行业内地位举足轻重。然而,在中国AI大模型竞争白热化之际,DeepSeek却仿佛隐匿起来。2月11日,DeepSeek仅悄然完成升级,当外界猜测“DeepSeek的新版本要发布了吗”,梁文锋及DeepSeek团队依旧保持缄默。
有时,越是沉寂,越令对手忌惮。
AI战事激烈,梁文锋却低调无声
这是中国AI发展史上一个颇为微妙的阶段。
先看大众感受最直接的“撒钱”行动——1月底,腾讯通过“元宝”发放10亿元现金红包吸引用户,同期百度投入5亿现金红包推广文心助手。很快,阿里千问带着30亿元红包活动引爆奶茶店消费,字节跳动也紧随其后,在豆包APP推出新春抽奖活动,最高可领取8888元现金红包。
资金持续投入,用户热情高涨,背后是头部AI大模型未来发展方向的激烈博弈。
产品层面,字节跳动点燃了一把火。2月14日,字节豆包大模型2.0正式发布,而在此前的2月7日,字节的视频模型Seedance 2.0已在全网引发热议,网友感叹:“文艺复兴与科技革命同时降临的时刻到了”。几乎同一时间,阿里迅速响应,发布新一代图像生成基础模型Qwen-Image 2.0,智谱、MiniMax等企业也纷纷推出新模型。
这场“你来我往”的竞争,透着一种默契的紧张感。相比之下,曾掀起大模型开源浪潮的DeepSeek则显得格外冷静。
实际上,此前已有一些相关消息传出。
据外媒The Information报道,DeepSeek计划在2月中旬(春节前后)发布代号为V4的新一代旗舰级AI模型,目标直指Coding AI领域的领先地位。但随后又有消息称V4可能无法按时发布,且DeepSeek内部对发布时间始终未明确回应。
2月11日,DeepSeek悄然完成更新,将上下文窗口长度从之前的128K token提升至1M(百万)token。当外界猜测这是否是V4的预览版本时,官方依旧保持沉默。
但这匹“不参与喧嚣战事”的神秘黑马,始终吸引着外界的关注。
2026年1月,DeepSeek团队连续发表两篇由梁文锋署名的论文——mHC(流形约束超连接)和Engram(条件记忆),当时市场便开始猜测:这是否与DeepSeek V4的核心技术有关?
在多数企业招聘节奏放缓的年底,DeepSeek仍在各平台持续招人。例如,DeepSeek官方账号在2月5日更新了产品经理、客户端研发工程师等多个岗位的招聘信息。
梁文锋曾说:“我们很多公司习惯跟随,而非创新。”如今,在行业巨头激烈竞争之际,外界都期待着这位曾以创新创造奇迹的颠覆者梁文锋能带来新的突破。
县城走出的状元,与中国的DeepSeek时刻
中国大陆最南端的广东湛江米历岭村,曾一度游客络绎不绝。
1985年出生的梁文锋就来自这里。父母都是当地小学教师,他从小成绩优异,初中时便学完高中数学,甚至开始接触大学数学内容。但相比考试排名,父母更关注他“今天解决了什么问题”。
这样的成长环境,与他后来在AI圈被称为“难得拥有纯粹技术理想的人”这一评价十分契合。
17岁时,梁文锋以吴川一中高考状元的身份考入浙江大学电子信息工程专业。2007年,他继续在浙大信息与通信工程专业读研,师从项志宇教授,主要研究机器视觉领域。
当时,计算机专业其实相对冷门,土木、电气自动化、金融国贸等专业更受青睐。一种刻板印象认为,学计算机的毕业后只能去电脑城修电脑、卖电脑,“就是个打工的”。
但梁文锋偏偏选择了这个专业。个人兴趣与时代变革,为这位天才少年的未来埋下了伏笔。
2008年全球金融危机爆发,还是学生的梁文锋敏锐地察觉到危机背后的机遇,与同学组建团队,开始用机器学习技术探索全自动量化交易。2015年,梁文锋与浙大同学徐进共同创立杭州幻方科技有限公司——这就是后来知名的幻方量化。
AI技术始终贯穿幻方量化的发展。早期,幻方的几乎所有量化策略都采用AI模型计算;2019年和2021年,幻方分别投入超10亿元建设自主研发的深度学习训练平台“萤火一号”和“萤火二号”。
发展顺风顺水,到2021年,幻方量化已成为千亿规模的量化私募机构。这一年,幻方获得英伟达A100显卡,其AI集群搭载的显卡数量达到“万卡级别”。值得注意的是,当时国内拥有超1万枚GPU的企业寥寥无几,除了幻方量化,其余基本都是互联网大厂。
38岁这一年,在金融领域已取得成就的梁文锋做出一个决定:创办DeepSeek,致力于通用人工智能的研究。
在他看来,这或许是满足自己对技术世界好奇心的一部分。DeepSeek不仅要复刻当时已名声大噪的GPT,更要如其公司名“深度求索”一般,真正投身大模型研究,引领行业生态发展。
愿景很快变为现实,且登场方式极具震撼力。2025年1月,距离春节还有一周,当时仅有近百人的DeepSeek团队上线DeepSeek R1版本,并慷慨开源。该模型推理能力可与全球顶尖模型媲美,但成本仅约几十万美元,彻底打破了“顶级模型需要千万美元级别投入”的认知。
至此,梁文锋在中国AI发展史上留下了重要的一笔:“DeepSeek时刻”。
巨头竞争,中国AI开启崭新时代
“AI最终是要服务于人的”,这一理念如今更为迫切。
即便是一向追求技术效能、专注研究的DeepSeek,也开始关注C端用户的实际需求。在其近期发布的产品经理岗位招聘信息中,职责部分明确写道:
·主导DeepSeek C端产品的功能规划与体验设计,敏锐捕捉用户需求,持续推动产品创新与体验优化;
·定位并拆解问题,降低用户使用门槛,关注用户增长,提升使用深度、粘性与转化;
·......
过去一年多里,许多DeepSeek的C端用户曾怀疑DeepSeek是否有产品经理。“页面和入口设计非常简单,仿佛不需要盈利”,一位DeepSeek个人用户如此评价,甚至调侃道:“它终于意识到我们C端用户是实现通用人工智能(AGI)的关键一环了。”
与DeepSeek的内敛不同,更急于商业化的大厂们则动作频频。
比如阿里投入30亿红包让千问接入奶茶点单场景,看似是烧钱获取用户,实则是AI时代培育用户心智的必要步骤。通过大众熟悉的补贴方式,先吸引普通用户使用千问,再让他们逐渐意识到AI不仅能点单,还能“解决实际问题”。
同样,准备登上春晚送福利的字节豆包,早已在各类生活场景中寻找切入点:帮用户搭配韩系帅哥风格的穿搭、为宠物拍摄艺术照、辅导孩子写作业......在这些角色扮演与情感互动中,豆包的月活跃用户已突破2亿。
种种迹象表明,大模型竞争的下半场,AI C端应用的需求爆发点即将到来。
这也让竞争回归最本质的逻辑:谁能解决用户的真实需求与问题,谁就能成为AI时代的超级入口。
对于向来依赖流量的互联网巨头而言,这场竞争意义重大——这是定义下一个十年互联网格局的关键机会。
本文来自微信公众号“投资界”,作者:冯雨晨,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com

