AI编程十字路口:为什么说Copilot方式是创业陷阱?
在整个人工智能产业中,「怎样才能为程序员创造更快的马?」而且在疯狂投入的时候,一个特立独行的团队选择「直接造车」。
「大模型的发展更像是一场刚刚完成第一节的篮球比赛。每个人都在用第一节的比分来判断整场比赛的输赢,但我们认为还有第二节、第三节和第四节要打。」蔻町智能(AIGCode)创始人兼 CEO 宿文用这样一种描述,为现在略显拥挤的事情描述。 AI 编程跑道,提供了不同的分析角度。
自 2022 年末 ChatGPT 到目前为止,点爆全球,AI 编程被广泛认为是最快最确定的大语言模型,可以实现严肃的商业化。(PMF)一条跑道。从 GitHub Copilot 在科技大厂和创业公司成功推出自己的编程助手之前,行业似乎已经形成了共识:AI 是程序员的「副驾驶」,其核心价值在于提高代码编写效率。
然而,宿文和他的蔻町智能正试图证明这是对最终结局的错误判断。在最后一次采访中,宿文拆解了他对机器的心。 AI 编程的三大「非共识」判断。
共识一:底座模型仍然处于不同的状态「婴幼儿期」网络结构创新是破局的关键。
在很多人眼里,大模型的底座对决似乎已经结束了。后来者,尤其是创业公司,只能在网络层面寻找机会。宿文对此有不同的看法:「在婴儿时期,我们认为大模型技术,或底座模型的发展。」
现在,他指出 Transformer 在学习机制和知识压缩效率方面,核心模型架构存在根本问题。「虽然 MoE 部分计算效率问题是通过专家分工解决的,但是专家之间有一些问题。 “偏平” 而且缺乏合作,总的来说还是依赖于简单的路由制度 “黑盒”。」
从成立的第一天起,蔻町智能就选择了自主研发的底座模型。它们的破局,正是对模型网络架构的不断迭代和创新。「我们在 MoE 在继续后续迭代的基础上,最后在推荐搜索领域使用了非常成熟的东西。 PLE(Progressive Layered Extraction)架构。」
他解释说,从 MoE 到 MMoE,解决了专家的解耦问题; PLE,然后进一步解决了专家解耦后可能出现的冲突和信息消耗问题,完成了对任务共性和个性的精细提取。

宿文表示,网络架构的创新使他们的模型在理解知识压缩和长逻辑链条方面具有不同于主流模型的潜力。

通过解耦专家模块,蔻町智能开发的AIGCoder架构图,通过解耦专家模块。(De-coupled Experts)改进传统模型,利用双头专家感知注意力(MHEA)负责动态激活专家,定制门控制(CGC)在不增加计算费用的情况下,负责对信息进行精细整合,通过架构创新来应对大模型拓展所遇到的瓶颈。

测试数据显示,无论是单个关键模块(左)还是整合后的完整结构(右),AIGCoder(橙色曲线)的练习效率比基线模型(蓝色曲线)高出1.3倍。
非共识二:「绕过大厂跑道」是个伪命题
在 AI 在这个领域,企业家经常听到一句劝诫——不要在大厂发展的道路上做生意,否则很容易被压垮。
但宿文认为这是一个伪命题。「假如真是一件大事,为什么大厂不做呢?更加准确地说,应该是“防止去摘下果实”。」
「真正的环城河,不在于选择一家大厂看不上的东西。 “间隙市场”,而是在同一领域,处理比大厂更复杂、更深入的问题。」
「现在的很多 Coding 商品以工程化的方式集成各种 API,生成一个可以接受的前端 Demo,这便是 “垂下果实”。蔻町的智能战略是通过底层技术创新实现真正的 “All-in-one”。」
这一融合思想,也体现在宿文对于 Agent 从发展的角度来看。他指出,目前的行业习惯性地将技术栈划分为 Infra、底座、OS、Agent 等层次,「它就像对上一代一样 PC 互联网和移动互联网技术结构的简单投射, “刻舟求剑” 公式对于新技术的定义意义不大。」
在新范式下,他强调,每一个技术环节都是深度藕合的。「从处理问题的角度来看,我们将综合解决问题。过早分工不利于提高效率,直到最终效果出来。」
蔻町智能把 AI for Coding 划分成 L1 到 L5 五个阶段:
L1:类似于低代码平台,目前并非主流;
L2:Copilot 商品,协助程序员,按要求生成代码,代表产品拥有代码。 GitHub Copilot、Cursor;
L3:Autopilot 货物,可以端到端完成编程任务,无需程序员介入;
L4:多端自动合作,让多个合作客户可以直接将软件创意转化为一种完整的产品;
L5:能自动迭代,升级为完善的软件产品。
宿文表示:「现在大部分 AI Coding 商品集中在 L2 阶段,而 AutoCoder 从一开始就定位了 L3。」
从 L2 到 L3,不是简单的量变。「把编程助手做到极致,不会自然地通向端到端的软件生成。」两者需要解决的技术问题和优化方向基本没有重叠:前者(Copilot)优化的是「敲代码效率」,核心是前后文理解和准确补齐;后者(Autopilot)处理「不敲代码」问题,核心是认识、拆解和生成复杂领域模型的长逻辑链。
此外,L2 需要和 IDE(集成开发阶段)紧密结合,对于大厂二人来说,有天然的优势,对于创业公司来说,有可能是一条事半功倍的险路。
非共识三:个性化应用市场即将爆发,新需求远远超过存量替代
坚持 L3 不但是技术上的选择,也是宿文和他的团队对未来市场的分析。尽管业界普遍认同 AI 程序设计的最终目的是赋予每个人权力,但是在实现路径上, AI 缺乏与普通用户相关的技术瓶颈,主流观点认为,目前最现实的路径,首先要协助程序员,解决股市的效率问题。
宿文认为这恰恰是一种感觉。「战略绕道」,由于 L2 不能自然地进化 L3,所以跟着 L2 离开,不但不能到达终点,更容易错过真正的蓝海——由大量个性化需求组成的增量市场,被当前的发展模式所压抑。
「新增加的需求远远大于股票的替代。程序员不会消失,但是一个全新的、数倍于当前规模的市场将会爆发。」
「就像有了滴滴才有了网约车市场,有了美团才有了外卖市场,」他对比说:「过去,人们对出租车和外卖的大量隐性需求被高成本和复杂的过程所压制。一旦有了低成本高效的供应模式,市场就会迎来爆发式增长。」
在软件开发领域,对于大量的中小企业、企业家,甚至大企业的业务部门来说,都有压抑的需求。例如,一个业务部门应该为内部开发一个培训系统。在传统模式下,整个过程往往需要几个月,试错成本极高,从漫长的需求沟通、高昂的开发投入,到最终交付对象偏离预期的风险。
蔻町智能希望将这一过程重塑为:「如果早晨能够明确定义需求,下午就能看到一种可以直接在线部署的商品。」
最新发布的蔻町智能端到端软件生成商品 AutoCoder,定位「全球首个前端和后端一体化应用和软件完整生成平台」,可以同时生成高度可用的前端、数据库和后端。例如,用户输入「帮助我在官网生成一家科技公司」,该平台不仅生成了客户可见的前台页面,还同步生成了后台系统,供企业员工管理网站内容和用户信息。
AutoCoder 受众不仅包括产品经理、设计师等专业人员(Prosumer),还包括大量非技术背景的个人从业人员、小企业主(如咖啡馆、健身房)、创业团队的非技术创始人等。他们有明确的数字化需求,但是被传统研发的高门槛挡住了。
宿文引用了一个数据:海外一家概念相似的企业,其产品的月浏览量在短时间内达到了近期发展。 20 年 GitHub 十分之一,而且 GitHub 数据本身并没有下降。这意味着一个新的、增量用户的市场正在受到刺激。
当然,L3 这条路最直观的质疑就是-端到端产生的软件。 Bug 怎么办?宿文的回应是:
「与其花几个小时去寻找一个 Bug,为何不需要几分钟就能重新生成正确的版本?」由于软件产生的边际成本接近于零,迭代和试错的自由将被前所未有地释放。
结语
自主研发基础模型,选择更难的端到端路径,看压抑的增量需求——这三个不一致但逻辑自洽的分析,形成了蔻町智能的核心战略和发展路线。
当然,选择一条很少有人走的路,必然伴随着质疑和不确定性。就像车辆诞生之初,远没有马车跑得快,甚至开了几公里就松了。蔻町智能「汽车」在性能、稳定性和可靠性方面,能否快速迭代到能否与成熟相匹配?「马车体系」在竞争甚至超越的时期,仍然需要时间和市场的检验。
但是毫无疑问,这个问题是关于的。 AI 编程篮球比赛才刚刚开始。一个挑战者已经选择了以自己的方式玩完全不同的游戏。从用户的角度来看,我们也很乐意期待一个软件创造权力被完全平等的未来。
本文来自微信微信官方账号 “机器之心”(ID:作者:闻菲,36氪经授权发布,almosthuman2014)。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




