当前位置:首页 > 科技资讯 > 正文

OmniCast:潜在扩散模型革新次季节至季节天气预报

加州大学洛杉矶分校与美国阿贡国家实验室的科研团队,共同研发出一款名为OmniCast的新型潜在扩散模型,该模型能够实现高精度概率性的次季节至季节尺度天气预报,为气象预测领域带来突破性进展。

次季节至季节(S2S)尺度天气预报,聚焦于未来2周至6周的天气演变,精准填补了中短期天气预报与长期气候预测之间的空白。这一尺度的预测对于农业规划、灾害防御等具有关键意义。然而,S2S预测面临巨大挑战:它既难以依赖快速衰减的大气初始信息(如中短期预报),又难以捕捉尚未充分显现的慢变边界信号(如气候预测),在混沌的大气系统和复杂的海陆气相互作用下,预报难度显著提升。

近年来,从传统数值天气预报系统到深度学习驱动的气象预测方法,技术迭代虽推动了S2S预报的发展,但在实际应用中仍存在诸多瓶颈。传统数值方法依赖于求解复杂的物理方程,计算成本极高且耗时漫长;数据驱动方法虽然在短期预报中实现了“快速、短期、精准”,但基于自回归设计的模型通过前一步预测结果计算下一步,在更长周期的S2S应用中会像滚雪球一样累积误差,同时忽略关键的慢变边界强迫信号。

针对这些问题,加州大学洛杉矶分校与阿贡国家实验室的团队提出了OmniCast模型,它结合了变分自编码器和Transformer架构,采用跨时空的联合采样方式,显著缓解了自回归方法的误差累计问题,并能够学习初始条件之外的天气动态规律。实验证明,该模型在准确性、物理一致性和概率性指标上均达到了当前最优水平。

相关研究以“OmniCast: A Masked Latent Diffusion Model for Weather Forecasting Across Time Scales”为题,入选AI顶级学术会议NeurIPS 2025。

研究亮点:

* 通过同时考虑时空维度来生成未来天气,OmniCast解决了以往基于自回归设计的模型误差累积问题。

* OmniCast能同时兼顾短期天气预报需要的大气初始信息和气候预测需要的慢变边界强迫条件。

* OmniCast在准确性、物理一致性和概率预测方面均优于现有方法,计算速度比现有主流方法快10-20倍。

OmniCast:潜在扩散模型革新次季节至季节天气预报 OmniCast模型  次季节至季节预报 潜在扩散模型 人工智能气象预测 第1张

论文地址:https://go.hyper.ai/YANIu

数据集:基于广泛使用的ERA5基础数据集,分类适配不同预测任务

为确保OmniCast在训练和评估中得到充分支持,研究采用了气象领域广泛应用的高分辨率再分析数据集ERA5作为基础数据源,并针对中期天气预报和S2S天气预报两个任务进行了数据预处理,以适配不同的基准测试集要求。

具体而言,研究从ERA5数据集中提取了69个气象变量,涵盖两大类核心指标:

地面变量(4类):2米气温(T2m)、10米U风速分量(U10)、10米V风速分量(V10)和平均海平面气压(MSLP)。

大气变量(5类):位势高度(Z)、气温(T)、U风速分量、V风速分量和比湿(Q)。大气变量覆盖13个气压层(单位:hPa),包括50、100、150、200、250、300、400、500、600、700、850、925、1000。

针对不同预报任务,研究根据时间范围划分了数据集:

中期天气预报任务:采用WeatherBench2作为基准测试集,训练集时间为1979~2018年,验证集为2019年,测试集为2020年,初始条件使用00时和12时的数据,分辨率为原生0.25°(721 x 1440网格)。

S2S天气预报任务:采用ChaosBench作为基准测试集,训练集时间为1979~2020年,验证集为2021年,测试集为2022年,初始条件使用00时的数据,分辨率为1.40625°(128 x 256网格)。

OmniCast模型:两阶段设计,构建S2S天气预测的新范式

OmniCast的核心优势在于整体规避了传统自回归模型的误差累积,构建了兼顾短期和长期预测条件的能力。模型架构基于“两阶段”设计:首先通过VAE实现数据降维,然后通过带扩散头的Transformer实现时序生成。

第一阶段的核心是采用UNet架构的VAE,其作用是将高维原始天气数据压缩为低维连续的潜在特征向量,从而提升计算效率。在S2S任务中,VAE编码器可将尺寸为69 x 128 x 256的数据压缩为1024 x 8 x 16的潜在映射,空间压缩比为16。生成时,VAE将潜在向量还原为原始维度的天气数据。

研究采用连续型VAE而非离散型VAE,因为连续型压缩比仅100倍,能保留更多气象关键信息,避免信息丢失。

第二阶段的核心是掩码生成式Transformer,采用掩码自编码器的编码器-解码器架构,实现无误差累积生成。它通过掩码训练和扩散预测直接建模未来全序列潜在向量。Transformer包含16层网络,每层16个注意力头,隐藏层维度为1024,dropout率为0.1。

OmniCast:潜在扩散模型革新次季节至季节天气预报 OmniCast模型  次季节至季节预报 潜在扩散模型 人工智能气象预测 第2张

Transformer主干网工作示意图

由于潜在向量是连续的,传统分类头无法建模其分布,因此在Transformer输出后接入扩散模型头(由小型MLP实现),用于预测掩码的潜在向量分布。

OmniCast:潜在扩散模型革新次季节至季节天气预报 OmniCast模型  次季节至季节预报 潜在扩散模型 人工智能气象预测 第3张

去噪网络 eθ 根据 zi 和 xsi 预测噪声 ϵ

为提升短期预报准确性,研究引入了辅助均方误差损失。通过添加额外的MLP确定性头,针对前10帧潜在向量计算MSE损失,并采用指数递减权重策略,突出早期帧的重要性。

成果展示:对标两类方法,效率远超基准模型达10~20倍

为验证OmniCast的有效性,研究人员将其与两类主流方法比较:最先进的深度学习方法和传统数值方法。实验涵盖中期天气预报和S2S天气预报任务,评估指标包括准确性、物理一致性和概率性。

在S2S天气预测任务中,OmniCast与PanguWeather、GraphCast等深度学习方法,以及UKMO-ENS、NCEP-ENS、CMA-ENS和ECMWF-ENS等数值模型集合系统进行了比较。

在准确性指标(均方根误差、绝对偏差和多尺度结构相似相)方面,OmniCast在短期预报时效内表现略逊于基准模型,但随着预报时效增加,性能逐步提升,10天后达到与ECMWF-ENS相当的最优水平。值得注意的是,OmniCast在所有基准模型中偏差最小,对目标变量的预报保持近零偏差。

OmniCast:潜在扩散模型革新次季节至季节天气预报 OmniCast模型  次季节至季节预报 潜在扩散模型 人工智能气象预测 第4张

在三个关键变量下,不同方法在1~44天预报时效内的预测确定性性能:实线代表深度学习方法,虚线代表数值方法

在物理一致性方面,OmniCast显著优于其他深度学习方法,且在多数情况下超过所有基准模型,表明其能有效保留不同频率范围内的信号,保证预报的物理合理性。

OmniCast:潜在扩散模型革新次季节至季节天气预报 OmniCast模型  次季节至季节预报 潜在扩散模型 人工智能气象预测 第5张

在三个关键变量下,不同方法在1~44天预报时效内的物理一致性指标:实线代表深度学习方法,虚线代表数值方法

在概率性指标(连续排序概率评分和离散技巧比)方面,OmniCast在较短预报时效内性能略逊于ECMWF-ENS,但15天后实现反超。总体而言,OmniCast与ECMWF-ENS是表现最优的方法。

OmniCast:潜在扩散模型革新次季节至季节天气预报 OmniCast模型  次季节至季节预报 潜在扩散模型 人工智能气象预测 第6张

在三个关键变量下,不同方法在1~44天预报时效内的概率性指标:实线代表深度学习方法,虚线代表数值方法

此外,OmniCast与今年提出的ClimaX和Stormer等长时效预测深度学习方法对比,在所有指标上均优于两者。在RMSE指标上,T850和Z500分别比ClimaX低16.8%和16.0%,比Stormer低11.6%和10.2%;在CRPS指标上,比ClimaX低20.2%和17.1%,比Stormer低13.9%和11.0%。这表明OmniCast通过潜在扩散模型与掩码生成框架的结合,在长时效天气预测中具有显著优势。

OmniCast:潜在扩散模型革新次季节至季节天气预报 OmniCast模型  次季节至季节预报 潜在扩散模型 人工智能气象预测 第7张

OmniCast与其他深度学习方法的准确性比较

在中期天气预测任务中,OmniCast与概率性预报的主流深度学习方法Gencast和数值集合预报系统IFS-ENS进行了对比。结果显示,OmniCast在所有变量和指标上的表现与IFS-ENS相当,仅略逊于Gencast。但在效率实验中,得益于潜在空间建模,OmniCast速度比所有基准模型快10~20倍。

OmniCast:潜在扩散模型革新次季节至季节天气预报 OmniCast模型  次季节至季节预报 潜在扩散模型 人工智能气象预测 第8张

不同方法在中期预报中的概率表现:实线代表深度学习方法,虚线代表数值方法

OmniCast在32块NVIDIA A100 GPU上仅需训练4天,而Gencast需要在32块TPUv5e上训练5天,NeuralGCM需要在128块TPUv5e上训练10天。推理阶段,OmniCast在0.25°分辨率下仅需29秒,而Gencast需要480秒;在1.0°分辨率下,OmniCast仅需11秒,Gencast需要224秒。

OmniCast:潜在扩散模型革新次季节至季节天气预报 OmniCast模型  次季节至季节预报 潜在扩散模型 人工智能气象预测 第9张

不同方法生成未来15天预报时的运行时间与分辨率对比

不断突破S2S预测桎梏,精准填补中远期天气预测空白

S2S天气预报作为衔接短期预报和气候预测的关键环节,在气象领域占据核心地位,已在学术研讨、技术攻关和场景应用层面构建了高效交流网络。

例如,今年5月由世界气象组织主办、山东大学承办的“AI+灾害预报预警国际研讨会”,吸引了全球三十多个国家或地区的专家学者,重点探讨了人工智能与S2S预测的结合,展望了其在防灾减灾中的应用前景。

在实验成果方面,复旦大学与上海科学智能研究院团队携手中国气象局,开发出名为“伏羲(FuXi-S2S)”的机器学习预测模型,可快速生成大型集合预测,7秒内完成42天的综合预测。

论文标题:A machine learning model that outperforms conventional global subseasonal forecast models

论文地址:https://www.nature.com/articles/s41467-024-50714-1

柏林工业大学、英国雷丁大学等团队,在S2S天气预报中引入“遥相关”现象(如平流层极涡和Madden-Julian震荡),并通过设计三种复杂度逐步升级的深度学习模型进行验证。其中,ViT-LSTM模型在第四周后对某些天气模式的预测准确性甚至超过了ECMWF。

论文标题:Deep Learning Meets Teleconnections: Improving S2S Predictions for European Winter Weather

论文地址:https://arxiv.org/abs/2504.07625

总之,随着人工智能和深度学习技术与气象领域的深度融合,S2S天气预报的难题正逐步被攻克。从古人的观云识天到如今AI模型的秒级生成,人类对天气的认知正迈向前所未有的清晰境地。