不融资无销售,华人公司爆赚10亿美金,估值达1000亿

07-31 07:09

这或许是整个AI圈里最低调、最赚钱的独角兽企业。

它既没有进行融资,也没有销售团队和市场公关部门,却悄然成为了为OpenAI、Anthropic、Google等一众明星公司提供服务的企业。

它就是Surge AI。

Surge AI成立于2020年,创始人是华人Edwin Chen。他毕业于麻省理工学院,曾在华尔街对冲基金、Google、Facebook从事算法工作,一路走到了AI领域的最前沿。32岁时,他毅然选择创业。

如今,Surge AI的赚钱效率比备受关注的Scale AI还要高。

团队规模超过1200人的Scale AI,年收入为8.5亿美元。而Surge AI仅靠120人的团队,年收入就超过了10亿美元。

据路透社报道,Surge AI正启动首轮融资,目标募资10亿美元,估值可能达到150亿美元(约合1000亿元人民币)。

不出意外的话,我们又将见证一家AI领域千亿级公司的诞生。

不融资、无销售,120人创造10亿美金收入

毫不夸张地说,在AI创业圈,Surge AI是个极为特殊的“异类”。

从创业之初,创始人Edwin Chen就做出了一个“反硅谷”的决定:不接受VC的投资

▲Surge AI创始人Edwin Chen(来源:Inc.com)

公司成立之初,仅靠他自己拿出的2500万美元维持运营。

不仅如此,在成立后的很长一段时间里,公司连一名专职销售都没有,业务增长完全依靠客户的自发推荐。

第一个客户来自Edwin的人脉圈。这个实验室拿到数据后,发现其质量远超市面上的其他供应商,于是很快将其推荐给了同行。

就这样,一家没有融资、没有销售的小公司,凭借数据质量赢得了OpenAI的认可,随后Anthropic、Google、Microsoft等公司也纷纷与其合作。口口相传之下,Surge AI成为了AI圈中“只靠推荐,无需宣传”的数据标注基础服务商。

Surge AI团队规模很小年收入超过10亿美元团队规模仅120人

相比之下,Scale AI团队规模高达1200人,是Surge AI的十倍,年收入却为8.5亿美元,未能超越Surge AI

为什么Surge AI会选择这种看似“缓慢”的发展模式呢?

Edwin Chen的观点很明确:“创业不应是一场追求地位的游戏。”

他是MVP(最小可用产品)理念的坚定支持者。他认为,90%的创业者在还未确定产品是否有价值时,就开始在朋友圈炫耀自己融资千万,登上TechCrunch头条,但这对用户而言毫无意义。

而Surge AI从第一个月开始就实现了盈利,不需要资金支持,更不希望通过销售去“推销”产品。他们希望客户是因为真正理解高质量数据的价值,才选择与他们长期合作。

没有了增长的压力,Surge AI从一开始就围绕“隐私优先、安全第一”的原则构建,无需为资本扩张而妥协,也不用为追求利润最大化而牺牲客户数据

在医疗、政府等领域,客户要求数据全链路“物理隔离”,Surge AI的工作流程——SOC II认证、专家专属标注通道,完全符合合规要求。

这套高度定制、毫不妥协的体系,与Anthropic等“安全主义”实验室的理念天然契合。如今,它已成为这些高度重视AI伦理与数据治理机构的首选供应商。

当然,Surge AI能在AI数据领域取得胜利,不仅依靠安全合规,还得益于其建立的高质量数据体系。

Surge AI如何赢得数据之战?

在大模型发展的现阶段,模型能力的瓶颈往往不在于参数量,而在于数据质量。

很多人认为合成数据是万能的。它确实有一定作用,但存在一个致命缺陷:合成数据只能让模型擅长解决“合成问题”,却无法应对真实世界的问题。

如今,许多模型在基准测试中表现出色,但在实际应用中却漏洞百出。

越来越多的公司找到Surge AI,称他们花费一年时间用合成数据训练模型,结果却全是错误的,现在不得不花费数月时间清理这些无用的数据。

要让模型像人类一样思考、判断,就必须为其提供真实反映人类视角的数据。以往那种“AI包工头”模式已经无法满足需求,靠人海战术堆积数据,无法让模型学到真本领。

Surge AI很早就洞察到了这一趋势,并迅速完成了转型。

它砍掉了低质量的流水线作业,转而搭建了一个名为“Surge Force”的精英网络

这看似只是一个数据标注工作,但并非任何人都能胜任。毫不夸张地说,想加入这个网络,比申请常春藤盟校还要困难

例如,对于OpenAI著名的数学数据集GSM8K,Surge AI会优先选择具有数学或STEM学位的标注员,如来自MIT等藤校的大学生。

仅有专业背景还不够,所有标注员还需提交5道试写题目,经另一名资深标注员审核通过后,才能加入团队。

之所以设置如此高的要求,是因为要让模型真正理解一件事情,必须依靠专业人士。因此,Surge AI聘请了许多律师、教师、工程师、多语种专家等,来完成这些看似繁琐的工作。

正是这种近乎苛刻的标准,让Surge AI的数据质量始终保持稳定。许多客户表示,Surge AI交付的几千条人工数据,比他们之前购买的上百万条合成数据更有价值。

除了招揽专业人才,Surge AI在技术方面也进行了创新。

Surge AI自主研发了一套动态标注引擎。它能够理解行业黑话,把握网络文化内涵,甚至对于“how dare you!”这样的句子,它也能准确判断出其中的愤怒、调侃或夸张情绪。

不仅判断准确,而且审查严格。Surge AI独创了“小数点后”级质控技术,准确率比Scale AI(98%)还要高。

Surge AI通过背靠背标注、多轮仲裁、AI辅助校验等方式,确保数据准确率达到99.99%。某企业的旧NLP数据集经Surge AI重新标注后,文本分类准确率显著提高,效果远超普通优化。

RLHF(人类反馈强化学习)是让大模型“理解人类语言”的关键步骤。Surge AI在这方面的进展比其他公司更为显著。

它不仅能够进行偏好排序、奖励建模,还能安排红队攻击,专门为模型提供一些“刁钻”的数据,促使其不断学习和进步。Anthropic团队曾表示,Surge AI的数据质控和RLHF工具,直接推动了Claude性能的突破。

除了数据质量高,Surge AI的效率也非常惊人。

据了解,某客户一次性下达了5000条多轮情感标注任务,按照200条一批的方式发送给Surge AI。结果第一批任务不仅按时交付,而且质量超出预期,于是Surge AI顺理成章地获得了后续合作机会。

总结

总的来说,Surge AI的崛起并非偶然。它抓住了四个关键趋势:

首先是满足高质量数据的刚性需求

RLHF技术的兴起,使得高质量的人类反馈成为模型性能的关键因素。客户直言:“没有Surge AI的数据,我们根本无法构建现有的模型。”

其次,Surge AI的技术质量为其树立了高壁垒定价权

精英网络和99.99%的质量目标构建了极高的竞争壁垒,客户对“小数点后精度”的刚性需求(AI安全容错率极低)赋予了Surge AI强大的议价能力。

第三,Surge AI的商业模式具有高利润可复制性

其深度融入客户的训练流程后,能够产生持续、高粘性的重复收入——因为数据是持续消耗品。

最后,中立性定位使它在行业格局中占据了一席之地。

Meta大力投资Scale AI,引发了OpenAI、Google等公司对“数据经过竞争对手之手”的担忧,大量订单转向了中立的Surge AI,这成为Surge AI在2024年收入超越Scale AI的关键因素。

在AGI的最终竞赛中,真正能够影响AI价值观的,不是模型架构,而是掌握人类反馈数据命脉的企业。而Surge AI,正是那个掌握AI命脉的玩家。

本文来自微信公众号“乌鸦智能说”,作者:智能乌鸦,36氪经授权发布。

本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com