当前位置:首页 > 科技资讯 > 正文

90后华人数学家破解塔 拉格兰卷积猜想

长久以来困扰数学界的塔 拉格兰卷积猜想,近日被一位90后华人数学家成功攻克!

苏黎世联邦理工学院的Yuansi Chen,在arXiv上发布了其最新研究成果:

90后华人数学家破解塔 拉格兰卷积猜想 塔 布尔超立方体 机器学习 正则化 第1张

论文证明了布尔超立方体上的塔 拉格兰卷积猜想(Talagrand’s convolution conjecture),其结果精确至一个log log η因子。

90后华人数学家破解塔 拉格兰卷积猜想 塔 布尔超立方体 机器学习 正则化 第2张

这一成果引起了广泛关注,其意义在于为理解高维离散空间中的平滑化提供了数学论证

此外,这项研究还与机器学习息息相关:

从理论层面支撑了机器学习中的正则化概念;

为开发处理离散数据的生成式AI模型提供了直接的数学工具和物理直觉。

破解30年数学难题

塔 拉格兰卷积猜想由“数学界诺奖”——阿贝尔奖得主Michel Talagrand在1989年提出。

首先,让我们了解两个关键概念:其一是“加热平滑”:

想象一个非常高维的空间,比如一个巨大的多维棋盘,每个方格的状态都是二元选择。其中有一个函数,这个函数可能非常“尖锐”,有的地方数值特别大,有的地方数值特别小。数学上的“卷积”或“热半群”操作,就像是对这个函数进行“加热”,使得热量扩散,高数值向周围低数值的地方流动。结果是函数变得平滑,尖峰被削平了。

其二是马尔可夫不等式:

马尔可夫不等式告诉我们,一个非负随机变量取到极大值的概率是很小的。比如平均值是1,那么数值超过100(η)的概率最多只有1%(即1/η)。

Talagrand的猜想是,在高斯空间或布尔超立方体等概率空间上对函数进行“加热平滑”(卷积)操作后,这个函数取到极大值的概率应该比马尔可夫不等式预测的还要低得多。

他认为这个概率不仅受1/η控制,还应该额外除以一个跟

90后华人数学家破解塔 拉格兰卷积猜想 塔 布尔超立方体 机器学习 正则化 第3张

有关的因子。

换言之,塔 拉格兰卷积猜想认为,经过平滑处理的数据,出现极端异常值的可能性比一般理论预测的要低一个特定的量级。

90后华人数学家破解塔 拉格兰卷积猜想 塔 布尔超立方体 机器学习 正则化 第4张

此前,这一猜想的高斯形式(连续空间)已被数学家们解决。但将其推广到布尔超立方体这样的离散空间,仍是一个巨大挑战。

因为高斯形式被解决的基础是连续空间中微积分和随机微分方程提供的平滑性和工具完备性,这些特性都无法直接被迁移到离散空间中。

对此,Yuansi Chen的解决思路是,借鉴高斯空间随机分析的框架,利用反向热过程的特性来设计微扰,以适应布尔超立方体的离散特性

具体来说,新的耦合构造利用了沿随机过程的扰动。其扰动项δ不是常数,而依赖于状态和坐标。

90后华人数学家破解塔 拉格兰卷积猜想 塔 布尔超立方体 机器学习 正则化 第5张

论文最终证明:

90后华人数学家破解塔 拉格兰卷积猜想 塔 布尔超立方体 机器学习 正则化 第6张

表明塔 拉格兰卷积猜想的核心思想是正确的。这一结果将原始猜想解决到了仅相差一个log log η因子的精度。由于log log η的增长极其缓慢,可以认为其接近完整解决了塔 拉格兰卷积猜想。

90后华人数学家

论文作者Yuansi Chen出生于1990年7月,浙江宁波人。

他的主要研究方向包括统计机器学习、马尔可夫链蒙特卡罗方法、应用概率、高维几何等。

90后华人数学家破解塔 拉格兰卷积猜想 塔 布尔超立方体 机器学习 正则化 第7张

他博士毕业于加州大学伯克利分校,师从华人统计学家郁彬。在苏黎世联邦理工学院从事了两年博士后研究后,于2021年至2024年在杜克大学担任统计科学系助理教授。今年初,他转入苏黎世联邦理工学院任副教授。

Google Scholar显示,他的论文被引次数为1623次,h指数为13。

90后华人数学家破解塔 拉格兰卷积猜想 塔 布尔超立方体 机器学习 正则化 第8张

此外,他还是斯隆研究奖的获得者。