当前位置:首页 > 科技资讯 > 正文

商汤科技发布方舟升级版,引领视觉AI 2.0革新

作者|黄楠

编辑|袁斯来

12月9日,在香港科学园举办的2025商汤科技AI论坛上,商汤科技正式公布了其旗舰平台“商汤方舟”的全面升级路线图。

当前,视觉人工智能已经成为智慧城市和产业智能化升级的核心推动力。然而,传统的视觉AI算法生产模式严重依赖专业算法专家,普遍存在研发周期长、成本高昂、入门门槛高等三大挑战。随着长尾应用场景的不断出现,传统算法模式难以满足大规模应用的需求。

商汤科技董事长兼首席执行官徐立博士表示,“过去十年是人工智能认知变化最快的十年,我们正经历可能是有史以来最大的技术浪潮。人工智能从感知到生成、从云端到边缘,再到如今的具身智能和世界模型,正在重塑各行各业的工作方式。”

商汤科技发布方舟升级版,引领视觉AI 2.0革新 商汤方舟 视觉AI 多模态大模型 具身智能 第1张

商汤科技董事长兼CEO徐立博士

商汤科技智慧城市与商业事业群高级总监朴元奎也指出,大模型时代的到来正在加速行业范式的重构。算法设计不再仅仅依赖专家,而是向现场工程师开放,模型应用也从“定制开发”转向“智能生产”。行业急需一种全新的视觉AI生产模式,以推动模型能力更快地适应业务需求,更高效地部署落地。

为此,商汤推出了视觉AI 2.0“商汤方舟”升级版,并围绕“通专融合”与“智训闭环”两大体系,构建了新一代视觉算法生产模式。

在“通专”模型编排层面,方舟通过轻量小模型与通用大模型的多级协同,实现长尾视觉任务的渐进式推理,既保证识别精度,又显著降低算力消耗;在“智训”体系方面,方舟以Agentic Training为核心,围绕数据智能构建、模型训练、评估与部署形成全流程闭环,使视觉模型生产从图像采集到业务决策实现端到端自动化,让一线工程师也能快速构建可用的视觉模型。

商汤科技发布方舟升级版,引领视觉AI 2.0革新 商汤方舟 视觉AI 多模态大模型 具身智能 第2张

商汤科技新一代视觉算法生产模式

同时,方舟平台正在打造“感知—决策—行为”一体化的视觉智能体平台,将数字世界的视觉理解与物理世界的具身行动连接起来,支持无人机、机器狗、无人车等异构终端协同感知与决策,推动巡检与巡逻场景迈向空地一体化智能。

基于多模态大模型能力,商汤方舟SenseFoundry能够高效调度多类视觉模型,构建贯穿场景感知、数据处理与智能决策的闭环工作流。其核心优势在于突破传统视觉AI的能力边界,不仅“看得见”,更能“读得懂、会思考、能决策”,推动城市治理从“被动回应”向“主动预判”转变。

这一技术突破也加速了产业智能化进程。以政务领域为例,商汤科技基于AIGC技术和传统计算机视觉技术,打造了“昆明人工智能赋能中心建设运营一体化项目”,致力于构建一个全方位、多层次的城市级人工智能服务体系,涵盖人工智能基础设施服务、人工智能基础共性应用支撑服务及典型智能化应用服务场景。

除内地核心市场外,商汤方舟的技术能力与平台体系也在港澳及海外市场持续拓展。

其中在港澳市场,随着香港智慧城市建设提速,城市治理场景对视觉AI提出了更系统化的需求。商汤科技香港及澳门业务总经理冯愈表示,方舟全新的平台化、模型化、智能体化体系,满足港澳市场“从分析到洞察、从洞察到决策”的需求。

目前,商汤方舟已在城市安全、交通、制造、无人机巡逻、具身智能等多个关键场景形成规模化应用,服务覆盖海内外近200个城市。

活动现场,在《从能力涌现到价值闭环,多模态大模型价值与创新之路》主题演讲中,商汤科技联合创始人、首席科学家林达华教授指出,经过三年“烈火烹油”式的发展,“我们再次走到了关键十字路口”,接下来行业发展有两条重要路径:一是AI需要真正落地应用,以价值驱动技术和应用的发展;二是需要回归实验室,探索下一次技术范式的原始创新。

商汤科技发布方舟升级版,引领视觉AI 2.0革新 商汤方舟 视觉AI 多模态大模型 具身智能 第3张

林达华教授在主题演讲中分享多模态大模型价值与创新之路

为此,商汤通过底层创新,包括原生多模态融合架构NEO、跨视角预测训练范式,以及高效率推理系统SekoTalk,可以有效提升模型的空间认知与实时交互能力,推动大模型从“AI for X”向“AI in X”深化,实现智能体与场景的深度融合。

随着人工智能迈入“大模型时代”,具身智能与世界模型正成为驱动产业变革的关键技术方向。商汤联合创始人、执行董事王晓刚博士在论坛上宣布,大晓机器人将于12月18日正式亮相,发布多项全球领先的技术与产品矩阵,并将推出首个国内开源且实现商业应用的“开悟”世界模型3.0;与生态伙伴共同构建“模型—硬件—场景”一体化产业生态,推进具身智能产业进步。

商汤科技发布方舟升级版,引领视觉AI 2.0革新 商汤方舟 视觉AI 多模态大模型 具身智能 第4张

圆桌论坛:从“数字世界”到“物理世界”:具身世界模型如何重塑人机交互

具身智能正逐步跨越从“数字世界”到“物理世界”的鸿沟。大晓机器人将为机器人装上聪明的“大脑”,让它们从“被动执行”转向“自主探索”;更要将前沿的智能,转化为可靠的产品,融入每一个具体的生活场景。