当前位置:首页 > 科技资讯 > 正文

《Faster R-CNN》获时间检验奖:计算机视觉的里程碑与未来展望

不久之前,NeurIPS 2025 顺利落下帷幕,作为人工智能领域的顶级学术盛会,这里汇聚了众多学术界巨匠的精彩工作和演讲。

其中,一项荣誉的颁发格外引人注目且实至名归 —— 任少卿、何恺明、Ross Girshick 和孙剑共同撰写的经典论文《Faster R-CNN》,荣获了「时间检验奖」 (Test of Time Award)

对于任何接触过计算机视觉的人来说,这个名字都绝不陌生。自2015年发表以来,《Faster R-CNN》无疑成为了该领域最具里程碑意义的工作之一。它不仅奠定了现代目标检测框架的核心范式,更如同一座灯塔,深刻影响了随后整整十年的视觉模型发展方向。

《Faster R-CNN》获时间检验奖:计算机视觉的里程碑与未来展望 Faster R-CNN 时间检验奖 计算机视觉 深度学习 第1张

论文地址:https://arxiv.org/pdf/1506.01497

《Faster R-CNN》获时间检验奖:计算机视觉的里程碑与未来展望 Faster R-CNN 时间检验奖 计算机视觉 深度学习 第2张

作为这一历史性时刻的见证与总结,何恺明在大会上发表了题为《视觉目标检测简史 (A Brief History of Visual Object Detection)》的演讲。

《Faster R-CNN》获时间检验奖:计算机视觉的里程碑与未来展望 Faster R-CNN 时间检验奖 计算机视觉 深度学习 第3张

何恺明演讲PPT已经公开,可以参阅以下链接:

https://people.csail.mit.edu/kaiming/neurips2025talk/neurips2025_fasterrcnn_kaiming.pdf

从何恺明的演讲内容来看,这不单是一个技术汇报,更像是一部计算机如何学会「看世界」的英雄史诗,总结了30年来视觉目标检测的发展历程。演讲中介绍的每一个工作,都获得了不同顶会的时间检验奖,对视觉智能的发展起到了决定性的作用。

你是否好奇:为什么现在的AI能在一瞬间识别出照片里的猫、狗、汽车甚至它们的位置,而在十几年前这却被认为是几乎不可能的任务?

《Faster R-CNN》获时间检验奖:计算机视觉的里程碑与未来展望 Faster R-CNN 时间检验奖 计算机视觉 深度学习 第4张

让我们跟随大神的视角,穿越回那个「原始」的时代,看看这一路是如何走来的。

原始:手工打磨的「放大镜」

在深度学习爆发之前,计算机视觉科学家们的工作更像是「工匠」的艺术。

人脸检测的早期尝试:早在90年代,科学家们就开始尝试用神经网络和统计学方法找人脸:

1996年:Rowley等人发表了《基于神经网络的人脸检测》(Neural Network-Based Face Detection),这是何恺明阅读的第一篇CV论文,利用早期的神经网络在图像金字塔上寻找面孔。

……