当前位置:首页 > 科技资讯 > 正文

光启未来:微软光学计算机挑战GPU极限

在过去的几十年里,科技巨头们在芯片领域的竞争愈演愈烈:芯片涨价、GPU短缺、AI算力焦虑...这一切的焦点都集中在芯片的不断迭代与升级。

然而,微软却在默默探索另一条道路:用光重新定义计算。他们花了四年时间,利用手机摄像头、Micro LED和透镜,打造出一台模拟光学计算机(AOC)。如今,这一实验已在Nature杂志上发表,带来了一个足以颠覆GPU的未来想象。

光启未来:微软光学计算机挑战GPU极限 光学计算机 AOC GPU 算力 第1张

光子登场:固定点搜索的秘密

传统的算力提升故事几乎都在硅片上书写:摩尔定律的加速、GPU的堆叠、能耗的焦虑。但在英国剑桥,微软研究院的一支小团队却选择了一条不同的道路——让光来算数。

他们打造的AOC,使用的材料并不稀有:Micro LED、光学镜头,还有来自手机的摄像头传感器。这看似像一台实验室“组装机”,却为算力开启了另一种可能。

光启未来:微软光学计算机挑战GPU极限 光学计算机 AOC GPU 算力 第2张

其实,光学计算的设想早在20世纪60年代就被提出,但受限于当时的工艺,一直停留在理论层面。如今,微软团队把它变成了现实。

AOC的真正秘密并不在于这些零件,而在于它的运行方式——固定点搜索。它巧妙地将光学和模拟电子电路结合在一个循环回路中:光学部分完成矩阵–向量乘法,电子部分处理非线性、加减法和退火操作。每次循环只需约20纳秒,信号在回路中不断迭代,直到收敛到一个稳定的“固定点”,而这个固定点就是问题的答案。

光启未来:微软光学计算机挑战GPU极限 光学计算机 AOC GPU 算力 第3张

这种方式解决了两个长期困扰光学计算的难题:一是避免了混合架构里高成本的数模转换,大幅降低能耗;二是天然具备抗噪声的优势。在迭代过程中,固定点就像一块磁铁,牢牢吸住答案,不会轻易跑偏。

从银行到医院:AOC的实战应用

微软团队希望通过实际应用展示AOC的潜力。他们选择了金融和医疗两个最具代表性的场景进行验证。

在金融领域,他们与巴克莱银行合作,将清算所每天面临的“货银对付”结算问题搬上了AOC。结果显示,AOC只用了7次迭代就找到了最优解。

光启未来:微软光学计算机挑战GPU极限 光学计算机 AOC GPU 算力 第4张

医疗领域同样展现了突破性。团队将MRI压缩感知成像重写成AOC能跑的优化问题,并在硬件上测试了一个32×32的Shepp–Logan phantom脑部切片图像,成功复原了原始图像。

光启未来:微软光学计算机挑战GPU极限 光学计算机 AOC GPU 算力 第5张

AI新路径:GPU之外的可能性

让研究团队最兴奋的突破,其实是人工智能领域的应用。在一次实验室里的午餐交流中,研究员Jannes Gladrow意识到:AOC的“固定点搜索”机制天然适合那些需要反复迭代、最终收敛到平衡状态的平衡模型(如深度平衡网络DEQ、现代Hopfield网络)。

光启未来:微软光学计算机挑战GPU极限 光学计算机 AOC GPU 算力 第6张

在GPU上,这类模型的算力消耗极大,而在AOC上,它们几乎就是“为光子而生”。于是团队尝试将一些简单的AI任务映射到AOC,结果很快出现:在MNIST和Fashion-MNIST分类任务上,AOC与数字孪生(AOC-DT)的结果几乎达到99%的对齐度;在非线性回归任务中(如拟合高斯曲线、正弦曲线),AOC同样表现稳定。

长跑与愿景:算力的另一条赛道

微软研究团队深知,目前的AOC还只是个原型,离真正的商用还有一段路要走。它现在能处理的权重规模是几百级别,但研究人员已经规划了扩展路线图:未来通过模块化扩展,每个模块可以支持约400万权重。几十到上千个模块的拼接,就能把整体规模推到0.1–20亿权重。

更震撼的是能效对比。团队估算,成熟版本的AOC有望达到500 TOPS/W(约2fJ/操作),而当前最先进的GPU(如NVIDIA H100)大约只有4.5 TOPS/W。这意味着能效差距高达两个数量级。

群星闪耀:拼出光学计算机的人

这台用光来思考的机器背后,不是某个天才的孤军奋战,而是一群跨学科研究者的集体智慧。Francesca Parmigiani是微软剑桥研究院的首席研究经理,她带领团队把一个在学术圈流传半个世纪的概念变成真实硬件。

光启未来:微软光学计算机挑战GPU极限 光学计算机 AOC GPU 算力 第7张

Jannes Gladrow是团队里的机器学习专家。一次非正式的午餐交流上,他突然意识到AOC的固定点机制与平衡模型天然契合。这一灵感让AOC不再局限于优化问题,而是第一次与AI紧密结合。