离开王慧文两年,创业者袁进辉搭上梁文锋的创业快车
AI创业热潮涌动,过去两年,创业者袁进辉的经历宛如两段奇幻之旅。
2023年3月,美团联合创始人王慧文收购了袁进辉的首个创业项目OneFlow。OneFlow是一个深度学习框架,能提升大模型训练效率。王慧文看中了袁进辉的技术能力。
随后,袁进辉和团队加入王慧文创立的光年之外。然而,2023年6月,王慧文宣布“病退”,王兴出手接盘,光年之外被美团收购,袁进辉也随之进入美团体系。
2023年8月,袁进辉决定离开美团,再次踏上创业之路,成立了硅基流动。他将目标锁定在AI Infra创业领域,这是位于芯片之上、大模型和应用之下的中间层,可通过技术手段实现模型的稳定高效调用。
今年1月20日,DeepSeek发布并开源R1推理模型,迅速走红。2月,袁进辉带领团队加班加点,春节也未休息,硅基流动联合华为云部署R1模型,这使得硅基流动官网的流量暴增40倍,一度超过腾讯云与阿里云。
袁进辉和DeepSeek创始人梁文锋还有一段故事。
离开美团后,袁进辉四处寻求融资。此时,梁文锋表现出“有意愿投资”的想法,但两人在开不开源的问题上存在分歧。梁文锋坚持模型推理部署引擎要开源,认为不开源没有出路,而袁进辉还未从OneFlow的创业经历中走出来——该项目因商业化不足,多次陷入资金周转困境。
“我们之前做开源深度学习框架OneFlow,开源不一定能带来成功,要先想清楚商业逻辑。”袁进辉对《中国企业家》表示。
因此,投资事宜没有了后续,但两家公司在业务上仍有往来。DeepSeek多次更新大模型时,袁进辉团队都会率先将其部署在硅基流动的服务器上,包括2024年5月发布的V2模型以及9月发布的V2.5。在一段时间内,硅基流动是唯一部署DeepSeek - V2和V2.5的第三方服务商。
从2016年开启首次创业,到2023年再次创业,袁进辉这样总结创业:“现在创业就像穿越沙漠,身上带着补给的水,若中途没找到绿洲,水可能就喝完了,无法穿越过去。但现在,我们找到了一块绿洲,如果绿洲足够大,我可能就留下,也可能补充给养后继续前行。”
补给就是获得投资人的资金,绿洲则是DeepSeek爆火带来的商业化机会,让硅基流动有了现金流和不断增长的业务。
硅基流动最新一轮融资于今年6月完成,由阿里云领投,金额达数亿元人民币,老股东创新工场等机构超额跟投,此前的投资机构还有美团(战略投资)、耀途资本、奇绩创坛等。
这就是一位连续创业者在AI时代的节奏。在技术快速迭代的背景下,没有永恒的壁垒,只能随着技术的发展不断前进,直到找到沙漠中那片足够大的绿洲。
大规模专家并行之战
2024年12月,DeepSeek发布V3模型前,梁文锋询问袁进辉团队是否先部署。袁进辉算了算,发现可能没有足够资金租服务器,大家还开玩笑说要赶紧融资,让投资人打钱。
部署V3模型有两个难点。其一,最优的部署结构是采用大规模专家并行,若不采用,生产效率会很低,成本也难以控制。要复现大规模专家并行,需要投入大量研发工作。
其二,进行大规模专家并行部署,需要大几十张卡或者几百张卡,一个月的租赁费用就要七八万元,若租几十台服务器,对于创业公司来说是一笔不小的开支。
到了2025年1月,基于V3模型架构的R1模型推出,引发的流量风暴让DeepSeek的APP和网页端崩溃,一天只能回答用户一个问题。第一周,DeepSeek APP的下载量为600万次,第二周就飙升至2000万次。其爆火加上春节人员流动,DeepSeek成为热门话题。

当时正值春节,袁进辉动员整个团队,春节不休息,技术团队周末也加班,这种情况一直持续到4月。除了DeepSeek官方,没有其他公司能在短时间内突破大规模专家并行技术,大家只能“开着飞机换引擎”,先堆砌资源接入流量,再更新推理引擎架构,逐步替换旧架构,这个过程大约持续了两个月。
抓住了流量红利,硅基流动在2月声名远扬,一夜之间成为C端应用。但C端小白用户多是尝鲜,留存率不高。当大厂的C端产品部署了DeepSeek后,用户就会转向大公司的产品,如腾讯元宝,第一季度月活跃用户数从数百万飙升至4000万。
这场流量大战提升了硅基流动的“品牌知名度”,在一些AI厂商的API调用窗口里,除了腾讯云、火山引擎、阿里云,“硅基流动”也是一个选择。
回顾这场爆发式的大战,袁进辉有不少收获:一是跑通了大规模专家并行,让其从“可用”变为“好用”;二是经历了大仗,开拓了市场,锻炼了团队,提升了品牌知名度。
大模型时代的商业化
MaaS(模型即服务)是大模型时代的商业模式,用户根据使用的Token数量付费。但一些创业者对此模式持不同看法。
袁进辉对《中国企业家》表示,MaaS服务能否盈利,取决于企业的能力,比如在技术上,能否用同样的算力实现更高的效率。
4月实现大规模专家并行后,其Token输出效率是未采用专家并行时的几十倍,存在盈利空间。
为解决外部公司部署难题,DeepSeek举办了“开源周”并发布相关论文,提到“V3/R1推理系统的优化目标是:更大的吞吐,更低的延迟。为实现这两个目标,我们采用大规模跨节点专家并行”。
袁进辉举例,若有40台机器,一个月租金三四百万元,满负荷运行的话,一个月生产的Token收入可能超千万。他强调“关键是跑满”,这涉及获客、机器错峰运行等运营效率问题。
袁进辉说:“作为供应商,能否做好MaaS,取决于能否驾驭这一系统工程。对于做Infra的公司,解决用户痛点和行业难题是本职工作。”
所以,当一些初创公司放弃部署DeepSeek提供MaaS服务时,袁进辉抓住了机会。
为吸引用户,硅基流动在MaaS平台推出后不久就推出“注册送14元,邀请成功送14元”的运营策略。袁进辉开玩笑说,这次爆火差点让现金流撑不住。
但他并不后悔,他认为做决策都有风险,“如果不尝试,只能等下一次机会,这次就没资格参与,只能去做软件销售或一体机项目。其实大家都想做最好的生意,那就是AI云服务。”
袁进辉说:“创业时,真正该担心的不是问题太有挑战,而是没有挑战,总是遇到容易的问题,没有意义。”
2025年,袁进辉认为整个AI行业都要思考商业化问题。
他说:“过去大家关注的都是技术问题,现在整个行业思考的是做什么产品,如何实现商业闭环。”
AI时代的创业——“焦虑”
对于硅基流动来说,2025年的关键词是高增长。
袁进辉说:“我们要提高市场占有率,无论是中小B客户还是大B客户,无论是公有云还是私有部署,甚至可以开拓海外市场,将其转化为绿洲。”
穿越“沙漠”,除了自带的补给,还需不断寻找绿洲。
袁进辉认为创业不是一蹴而就的。字节跳动也不是一开始就做抖音,中间有多次跃迁。“抓住现有商机,标准化产品,提高市场占有率,建立对抗风险的安全港,才能在未来抓住更好的机会,做出更好的产品。”
做AI Infra创业,本质是在大公司的竞争缝隙中寻找机会,在激烈竞争中突围,但其产品保鲜期比纯C端产品长,壁垒也更厚。
硅基流动的优势之一是“中立”,与模型厂商不同,后者推广大模型云服务时,优先销售自己的模型。
袁进辉说,现在AI处于野蛮生长阶段,大公司的影响力也有覆盖不到的地方,此时最重要的是不顾一切地向前冲。
就像模型能力有上限一样,AI Infra技术也有天花板,无法长期大幅领先竞争对手,关键是做好细节优化和工程聚焦。
“焦虑感是现阶段AI公司的特征,各领风骚一时,不能停下脚步。”袁进辉总结道。
重新开始,袁进辉想再次挑战自己。“从刺激程度看,不仅要做好技术,还要做好产品和商业。就像玩游戏,一关一关地过,如果总是重复同一关,很快就会厌烦,失去兴趣。”
本文来自微信公众号“中国企业家杂志”(ID:iceo - com - cn),作者:闫俊文,编辑:张晓迪,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com



