当前位置:首页 > 科技资讯 > 正文

Matrix-3D:从单图到无限世界的生成革命

中国自研世界模型Matrix-3D,凭借单张图片即可生成自由探索的3D世界,效果直追李飞飞的World Labs,同时实现了更广阔探索空间,引领AI理解世界的前沿。

一叶一世界,一图一乾坤。

长久以来,人类只能凭借想象勾勒世界轮廓,梦境与现实之间仿佛隔着一层薄纱。

如今,AI的力量已无限延伸,这层薄纱被彻底揭开——

Matrix-3D,真正实现了「一图生万境」的世界模型!

它不仅是中国公司昆仑万维的第一款,也是首个全自研世界模型「Matrix-Zero」的升级版。

进化后的Matrix-3D,可以从一张山间草地的照片出发,创造出风吹草动、远山起伏的全景风光。

Matrix-3D:从单图到无限世界的生成革命 Matrix-3D 世界模型 AI生成 空间智能 第1张

Matrix-3D:从单图到无限世界的生成革命 Matrix-3D 世界模型 AI生成 空间智能 第2张

从现代城市一角出发,它能「脑补」出繁华街道和大厦。

Matrix-3D:从单图到无限世界的生成革命 Matrix-3D 世界模型 AI生成 空间智能 第3张

Matrix-3D:从单图到无限世界的生成革命 Matrix-3D 世界模型 AI生成 空间智能 第4张

无需多视图,无需局限于局部透视,Matrix-3D实现了几何结构精确、可自由漫游的3D世界。

值得一提的是,本周是昆仑万维AI技术发布周,而Matrix-3D是第二个出场的模型。

挑战空间智能的核心痛点

大模型赛道已卷两年,众人都在观望下一个破局方向。

李飞飞仅用3个月实现10亿估值的World Labs证明:具有空间智能的世界模型正是AI理解世界的下一个前沿。

最近,谷歌发布的Genie 3再次引发对「世界模型」的期待,它能以每秒20-24帧速度实时生成720p画面,并持续数分钟一致性。

Matrix-3D:从单图到无限世界的生成革命 Matrix-3D 世界模型 AI生成 空间智能 第5张

作为探索,昆仑万维在今年2月发布了自研的Matrix-Zero世界模型:

  • 用户输入图片转化为可自由探索的真实合理3D场景;
  • 根据用户输入实时生成互动视频效果。

Matrix-3D:从单图到无限世界的生成革命 Matrix-3D 世界模型 AI生成 空间智能 第6张

全新发布的Matrix-3D首次具备「从一图入实境」的构建能力,世界模型再次进化:

  • 场景全局一致:支持360°自由视角浏览,几何结构准确、遮挡关系自然、纹理风格统一。
  • 生成场景范围大:与现有方法相比,支持更大范围的可自由探索场景生成。
  • 生成高度可控:支持文本和图像输入,结果与输入高度匹配,支持自定义范围与无限扩展。
  • 泛化能力强:基于自研3D数据与视频模型先验,可生成丰富多样的高质量场景。
  • 生成速度快:首个前馈全景3D场景生成模型,可快速生成高质量3D场景。

Matrix-3D:从单图到无限世界的生成革命 Matrix-3D 世界模型 AI生成 空间智能 第7张

技术报告: 项目主页: Github: Hugging Face

接下来,我们来直观感受一下Matrix-3D的「威力」吧。

画面一致性

无论是内容还是颜色,都能统一一致。

在视角上,Matrix-3D支持360°自由环视。

一个动漫风格的村庄:草屋顶的房子、风车、花田延伸至地平线,氛围舒适温暖。

Matrix-3D:从单图到无限世界的生成革命 Matrix-3D 世界模型 AI生成 空间智能 第8张

Matrix-3D:从单图到无限世界的生成革命 Matrix-3D 世界模型 AI生成 空间智能 第9张

物体之间的几何和遮挡关系符合物理定律。

一幅印象派风格的冬日风景:包含山脉、湖泊、小屋、树木和积雪,以蓝色调为主,笔触质感丰富,氛围宁静。

性价比服务器免费服务器