当前位置:首页 > 科技资讯 > 正文

Surge AI:无融资破10亿,数据质量成就AI时代神话

在Meta豪掷143亿美元入股竞争对手Scale AI之际,这家由谷歌前工程师创立的公司,员工数量仅为对手十分之一,却已悄然实现年营收超10亿美元,且从未接受过外部投资。

Surge AI:无融资破10亿,数据质量成就AI时代神话 AI 数据质量 AI模型训练 无融资增长 第1张

AI竞技场上,明星企业如OpenAI、Google等常因发布下一个万亿参数模型而备受瞩目。然而,决定模型“思维”与“品格”的训练数据,却往往被忽视。

硅谷上演着一出对比鲜明的戏剧:一边是Meta巨资收购数据标注公司Scale AI近半股份,使其创始人亚历山大·王成为硅谷红人;另一边,是其低调对手Surge AI:成立近五年无任何融资,员工仅为对手十分之一,却悄然实现超过10亿美元的营收,在财务上已超越获得巨资的Scale AI。

这次故事的主角轮到了Edwin Chen。

Surge AI的创始人兼CEO Edwin Chen是一位美籍华裔,曾在Massachusetts Institute of Technology(MIT)学习数学与语言学。毕业后,他在包括Google、Meta Platforms(前身Facebook)以及Twitter等科技公司工作,负责机器学习、人类计算与内容审核等项目。通过这些经历,他亲眼见证了一个严峻问题:即便是资源雄厚的大厂,在将海量原始数据转化为高质量、“适合用于训练AI模型”的数据时,也常因标注粗糙、质量参差不齐而失败。

有一次,他参与的一个项目需要人工标注五万条信息流,然而外包结果令他震惊——俚语、梗图、社交语境、歧义表达等“低级错误”层出不穷,使得输出数据几乎无法用于高质量模型训练。正是这个经历,让Edwin意识到:整个行业,哪怕是顶级公司,也严重低估了“数据质量”对未来AI的关键性。

于是,在2020年,他做出了一个大胆决定:离开舒适安稳的工作,创立一家专注“高质量、高复杂度、人类标注 + AI训练基础设施”的公司。Surge AI由此诞生。

为了保证数据质量,Surge AI构建了一套复杂的技术和筛选体系。

公司组建了一个名为“Surge Force”的精英标注员网络,准入门槛极高。申请者除了需要过硬的专业背景,还需提交5道试写题目,经另一名资深标注员审核通过后才可加入。该网络不仅包括来自全球的专业人士,甚至聘请了斯坦福、普林斯顿和哈佛的教授来参与训练AI,旨在将人类的专业知识、创造力和价值观编码进数据。

更重要的是,Surge AI开发了先进的人机协同系统和算法来保障质量。系统精细追踪每一位标注者的数千个行为信号,并用机器学习反向分析,以检测和对抗低质量标注行为。

他们发现,即使是麻省理工学院的毕业生也可能试图用各种方式“欺骗”系统。因此,单纯依赖“聪明人”无法保证质量,必须依靠技术体系。

这样可靠的数据支持,为Surge AI赢得了最顶尖的客户群和极高的议价能力。

公司的客户名单几乎囊括了所有AI巨头:OpenAI、Anthropic、谷歌、微软、Meta。仅Meta的生成式AI部门,2024年在Surge AI的服务上支出就超过1.5亿美元。

凭借扎实的技术和高门槛的服务,Surge AI在成立第一年就实现了盈利。

Surge AI:无融资破10亿,数据质量成就AI时代神话 AI 数据质量 AI模型训练 无融资增长 第2张

在这样一家几乎以不可能速度增长的公司背后,人们最好奇的往往不是商业数字本身,而是推动这一切的第一性原理:Surge是如何构建出业内最可靠的数据质量体系?为什么Edwin坚持在没有外部资本加持的前提下,将公司推向十亿美元规模?在模型能力指数级攀升的当下,数据、评价与训练环境究竟扮演着怎样的战略角色?

近日,Edwin做客《Lenny's Podcast》,与Lenny展开了一场深入的对话。在对话中,Edwin以他一贯的清晰逻辑和务实风格,讲述了Surge的起点、它如何服务未来的AI基础设施,以及为何数据公司有机会成为下一个时代真正的“基础设施级企业”。

成立四年0融资,如今营收破10亿美元

Lenny:我想先从你们的成绩有多“夸张”说起。很多人、很多公司都在谈论——借助AI,通过极少的人手把业务规模做到巨大。而你们是第一次真正把这件事做到如此“前无古人”的程度。你们在不到4年时间里做到10亿美元营收,员工也就60~70人的样子,而且完全没有融资、没有VC。我相信没人做到过这一点。你们真正实现了外界口中“AI时代企业的梦想”。我很好奇:你觉得未来是否会出现越来越多这种情况?另外,AI在哪里最帮你们实现了这种杠杆效应?

Edwin: 我们去年营收超过10亿美元时,公司还不到100人。我认为未来几年会出现更极端的公司,例如“每位员工贡献1亿美元营收”这种情况一定会发生。AI会越来越强、越来越高效,这个比例是不可避免的。

我以前在多家大型科技公司工作时就感觉,其实裁掉90%的人,公司反而会更快,因为真正厉害的人经常被各种无关事务拖累。我们创办Surge时,就决定完全用不一样的方式做公司——一个极小、极精英的团队。最疯狂的是,我们真的做到了。

Surge AI到底做什么?

Lenny:为了不太了解Surge的听众,你能快速解释一下你们是做什么的吗?

Edwin: 我们本质上是在“教AI模型什么是好、什么是坏”。我们用真人数据训练模型——包括SFT、RHF、Rubrics、Verifiers、R环境等等各种系统。我们也测量模型在训练后进步了多少。所以,我们是一家“数据公司”。

“我关心的不仅仅是公司营收”

Lenny:这正是我们现在在做的事情。所以这真的很有趣。这可能是我们达到AGI之前的最后一步。沿着这个思路,Surge有一点非常独特,我了解到你们有自己的研究团队,我认为这相当罕见。谈谈为什么你们要在这方面投资,以及这项投资带来了什么?

Edwin: 是的,我认为这源于我自己的背景。我自己的背景就是一名研究员……我本质上是个科学家……所以我的目标是利用我们公司所有这些独特之处来确保我们正在以一种对人类物种长期真正有益的方式塑造AI。