当前位置:首页 > 科技资讯 > 正文

AI巨头静悄悄,梁文锋的DeepSeek成神秘黑马

AI巨头静悄悄,梁文锋的DeepSeek成神秘黑马 DeepSeek 梁文锋 AI大模型 神秘黑马 第1张

梁文锋

作者/冯雨晨

此刻,群雄逐鹿。

互联网巨头纷纷抢占牌桌,它们的野心昭然若揭:皆欲自家AI大模型应用成为顶尖流量入口。而在AI大模型的竞技场上,梁文锋曾是一位显赫的选手。

就在一年前,他恰好名声大噪。回溯至2025年春节前一周,梁文锋引领DeepSeek发布了推理大模型R1,以惊人的低成本,炼就与世界顶级模型并驾齐驱的性能,自此东方神秘力量成功征服全球科技界。

这位来自广东湛江的85后,鲜少露面,身家上百亿,他所创立的DeepSeek在业界地位毋庸置疑。然而,在中国AI大模型激战之际,DeepSeek似乎隐匿了踪迹。2月11日,DeepSeek悄然更新升级,当外界纷纷猜测“DeepSeek新版本即将问世”,梁文锋及DeepSeek依然保持沉默。

有时候,宁静之中往往暗藏玄机。

AI烽火连天,梁文锋却静谧无声

这是中国AI史上一个微妙的时刻。

大众体感最强烈的发钱活动——1月底,腾讯撒出10亿元现金红包激励用户,同时期,百度投入5亿推广文心助手。迅速,阿里千问带着30亿元红包席卷市场,字节也紧随其后,豆包APP上参与新春抽奖最高可领8888元现金红包。

资金在燃烧,用户在狂欢,背后折射出头部AI大模型未来命运的较量。

产品方面,字节放出了一把火。2月14日,字节豆包大模型2.0正式官宣发布,而此前2月7日,字节视频模型Seedance 2.0火爆全网,网友直呼:“一个文艺复兴和科技革命同时发生的时刻到来”。几乎同时,阿里迅速出击,发布新一代图像生成基础模型Qwen-Image 2.0,还有智谱、MiniMax也加入战局,齐发新模型。

此番“招招有回应”,颇有一种诡异的竞争默契。而反观曾经掀起大模型开源革命的DeepSeek则显得颇为冷静。

实际上,早有风声。

据外媒The Information报道,DeepSeek计划在2月中旬即春节前后发布代号为V4的新一代旗舰级人工智能模型,目标直指Coding AI王座。但随后又有报道提到V4可能无法按时发布:DeepSeek内部对发布时间保持沉默。

就在2月11日,DeepSeek悄然更新,上下文窗口长度从128K token直接提升至1M(百万)token。当外界猜测该版本可能是V4 Preview时,官方依然保持沉默。

但这匹“不问战事”的神秘黑马始终吸引着外界的目光。

2026年1月,DeepSeek团队密集发布了两篇由梁文锋署名的论文——mHC(流形约束超连接)及Engram(条件记忆),市场开始揣测:这是否与DeepSeek V4核心技术相关?

在多数公司招聘节奏放缓的年末,DeepSeek仍在各平台持续招聘。如DeepSeek官号上,其2月5日更新了产品经理、客户端研发工程师等多个岗位。

“我们大多数公司习惯跟随,而非创新。”梁文锋曾这样表示。如今,在诸神混战的时刻,外界都在期待那位曾创造奇迹的颠覆者——梁文锋。

县城状元,与中国DeepSeek时刻

中国大陆最南端,广东湛江的米历岭村一度游人如织。

1985年出生的梁文锋就来自这里。父母都是当地小学老师,他从小成绩优异,在初中就学完高中数学,甚至开始接触大学数学。相比考试排名,“今天解决了什么问题”,才是梁文锋少年时期父母更关注的。

这样的成长经历与多年后他在AI圈中被称为“难得拥有纯粹技术理想的人”相得益彰。

17岁那年,作为当地吴川一中的高考状元,梁文锋考入浙江大学电子信息工程专业。2007年,他继续在浙大信息与通信工程专业读研,师从项志宇,主要进行机器视觉研究。

当时计算机其实算个冷门专业,土木、电气自动化、金融国贸等更为热门。有一种刻板印象是,学计算机的毕业后就要去电脑城修电脑卖电脑,“就是个打工的”。

但梁文锋偏偏选择了这条道路。个人兴趣与时代巨变为这位天才少年的未来埋下伏笔。

金融危机2008年席卷全球,彼时还是学生的梁文锋敏锐捕捉到危机背后的机遇,与同学一起组建团队开始使用机器学习等技术探索全自动量化交易。2015年,梁文锋与浙大同学徐进正式创立杭州幻方科技有限公司——这便是后来大名鼎鼎的幻方量化。

AI始终贯穿幻方。在早期幻方就几乎所有量化策略都采用AI模型计算。2019年及2021年幻方投了逾10亿元建设自主研发深度学习训练平台“萤火一号”及“萤火二号”。

一路高歌猛进到2021年幻方量化成功跻身千亿量化私募之列。这年幻方量化拿到英伟达A100显卡并且其AI集群搭载显卡的数量达到“万卡级别”。值得注意的是此时国内超过1万枚GPU的企业屈指可数除了幻方量化其余几乎都是互联网大厂。

38岁这一年金融大佬梁文锋做了一个决定:创办DeepSeek要做通用的人工智能。

在他看来这或许是满足对技术世界好奇心的一部分。DeepSeek要做的不止是复刻当时已经名声大噪的GPT而是如其公司名一般深度求索——真正去做关于大模型的研究引领行业生态。

愿景很快变为现实出场极其震撼。2025年1月距离春节还有一周彼时近百人团队的DeepSeek上线DeepSeek R1版本直接慷慨开源推理能力比肩世界顶尖水平但成本仅约几十万美元彻底颠覆顶级模型需要千万美元级别投入的认知。

至此梁文锋在中国AI进程史上留下了珍贵一笔:DeepSeek时刻。

诸神之战中国AI崭新时代

“AI还是要给人用的”如今更为迫切。

诚如一向追求效能致力做研究的DeepSeek也开始关注C端具体的人。在其近期一则产品经理岗位招聘中职责一栏写道:

·主导DeepSeek C端产品的功能规划与体验设计敏锐洞察用户需求不断推动产品创新和体验优化;

·定位并拆解问题降低用户使用成本关注用户增长提升使用深度、粘性和转化;