《自然》杂志揭晓2025年度十大科学人物,DeepSeek创始人梁文锋与中国科学院深海科学与工程研究所研究员杜梦然荣耀上榜。
梁文锋荣登《自然》2025年度十大人物榜单,被誉为“科技颠覆者”!
Nature高度评价:梁文锋的DeepSeek AI模型彻底改变了世界!
官方报道以“中国金融奇才”的DeepSeek AI震撼全球进行描述。
今年1月,中国DeepSeek公司发布的R1模型引发人工智能界震动!
同时,Nature以“让科学家感到兴奋”为题进行了专题报道。
R1是首个以开放权重形式发布的推理大语言模型(LLM),允许研究者免费下载和基于此模型进行开发,为算法适配到自身领域的研究人员提供了巨大便利。
DeepSeek的成功似乎激励了中美其他公司纷纷效仿,相继发布各自的开源模型。
尽管R1在多项能力上与美国顶尖模型(包括驱动ChatGPT的模型)不相上下,但人工智能专家指出,其训练成本远低于竞争对手。
例如,Meta的Llama 3 405B模型的训练成本高出十倍以上。
DeepSeek对透明度的追求还体现在:去年9月该模型成为首个接受同行评议的主流LLM时,公司完整公布了构建和训练R1的技术细节。
通过公开其配方,DeepSeek为其他AI研究者提供了宝贵的训练推理模型经验。
总部位于纽约的社区人工智能平台HuggingFace研究员Adina Yakefu表示:“从许多方面来看,DeepSeek已经产生了巨大影响力。”
梁文锋出身于广东乡村,父母均为小学教师,这样的成长环境与如今AI领域的高峰相去甚远。
高等教育将他带到了杭州浙江大学,并于2010年获得工程学硕士学位;他的论文涉及设计算法来追踪视频中的物体。
很快,他将对人工智能的热爱应用于金融市场,并于2015年联合创立了对冲基金高飞资本(High-Flyer),随后在2023年分拆出DeepSeek公司。
当时,中国在开发LLMs方面面临障碍。
美国的出口管制阻止了中国公司购买某些由美国芯片制造商英伟达生产的强大计算机芯片,即图形处理单元(GPU),这些芯片适合训练LLMs。
但梁文锋早有准备。
出于对能在这些芯片上进行何种研究的好奇心,他在过去十年里购买了约一万块英伟达GPU。
在2023年接受中国媒体公司36氪采访时,他将这些购买行为比作为家中购买钢琴:买得起,而且有一群人渴望在上面演奏音乐。
与许多西方人工智能企业家一样,梁将目光投向了实现通用人工智能的目标,并围绕这一目标塑造了他的公司,前DeepSeek研究员Benjamin Liu表示。
公司在招聘时更看重个人潜力而非经验水平(DeepSeek R1论文的一位作者仍在读中学),且组织架构扁平化,研究人员可自主决定研究方向。
据悉梁深度参与研究工作,实习生也被视为承担重要职责的正式员工,Benjamin Liu表示。
公司外部的研究人员对DeepSeek的运营方式印象深刻。
专注于人工智能安全的咨询公司Concordia AI的国际人工智能治理负责人Kwan Yee Ng表示,DeepSeek没有利用其知名度追求商业成功,而是始终致力于解决人工智能研究中相当困难的基础性问题。
DeepSeek模型已深度融入中国人的生活:地方政府正利用它们运营聊天机器人热线、协助市民填写表格,每天有数千万人通过国内社交媒体平台微信使用这些模型。
“《自然》年度十大人物”榜单旨在记录一年中的重要科学趋势与发现,并讲述相关人物的故事。
“该榜单由《自然》编辑团队编纂,旨在彰显那些塑造世界格局的最具影响力研究与重大进展。”
“《自然》称他创立的中国人工智能企业开发出DeepSeek大语言模型“震惊了世界”,这一开源模型对科学家们来说无疑是一大福音。”
“被《自然》称为“深潜者”,榜单强调她在海平面9千米以下发现了地球上最深的动物生态系统。”
本文由主机测评网于2026-05-23发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260545906.html