当前位置:首页 > 科技资讯 > 正文

顶尖AI科学家许主洪加盟阿里通义,强化多模态大模型研发

顶尖AI科学家许主洪加盟阿里通义,强化多模态大模型研发 许主洪  阿里通义 多模态大模型 人工智能 第1张

9月29日,据“互联网八卦小喇叭”等媒体透露,国际知名AI科学家、IEEE Fellow许主洪(Steven Hoi)现已加入阿里通义团队,专注于通义大模型的研发工作。

许主洪在AI领域拥有超过20年的产业和学术经验,现任新加坡管理大学终身教授,并曾担任新加坡南洋理工大学终身副教授。他在AI领域发表了300余篇顶级学术论文,被引用次数超过5万次,获斯坦福大学评为全球前1%的AI科学家

作为多模态大模型领域的领军者,许主洪曾任职全球最大企业软件公司Salesforce的副总裁,从零构建了Salesforce在亚洲的AI研究生态系统;他还在2023年创立了多模态AI初创企业HyperAGI,堪称业界罕见的产学研多栖AI专家

顶尖AI科学家许主洪加盟阿里通义,强化多模态大模型研发 许主洪  阿里通义 多模态大模型 人工智能 第2张

▲许主洪

2025年2月,许主洪加入阿里巴巴并担任集团副总裁、智能信息事业群首席科学家,向智能信息事业群总裁吴嘉汇报,负责AI To C业务的多模态基础模型及智能体(Agents)研究与应约

按照原定规划,许主洪的核心任务包括组建顶尖AI算法团队,整合通义(应用)、夸克、天猫精灵等内部资源,推动多模态交互产品迭代,加速AI To C商业化进程。

在2025年6月的上海世界移动通信大会上,许主洪发表了题为《多模态大模型发展与演进》的演讲,其中以夸克App的AI超级框、AI相机等功能为例,阐述了多模态大模型的应用场景。

顶尖AI科学家许主洪加盟阿里通义,强化多模态大模型研发 许主洪  阿里通义 多模态大模型 人工智能 第3张

▲许主洪以夸克为例讲解多模态大模型应用场景

然而,在加入阿里7个多月后,许主洪据悉已加入通义实验室团队,这暗示他可能从面向AI To C的商业化研发转向更基础前沿的大模型研发。

如若消息确认,这将意味着阿里巴巴完成了一次重要的人才重新配置,也标志着其在多模态大模型研发领域再次加大投入。

当前,阿里通义大模型正处在“比拼迭代速度”、“多模态发展”的关键时期,急需许主洪这样对口、顶尖且具分量的产学研多栖AI专家领军。

在9月底的2025云栖大会期间,阿里云智能集团首席技术官、通义实验室负责人周靖人透露,连续发布数十款模型背后有战略考虑:全球AI模型进展加速,整个通义家族持续与全球AI领先者竞速,AI已进入加速期,核心是模型迭代效率;同时模型从单模态向多模态演进是必然趋势,阿里期待在多模态方面实现进一步创新与突破。

许主洪或许是当前阿里最适宜牵头此事的人选。他在今年5月蚂蚁技术开放日的演讲中提及,当前,采用统一框架进行理解与生成,是多模态大模型发展的重要趋势。但该领域仍处初级阶段,需实践验证。

顶尖AI科学家许主洪加盟阿里通义,强化多模态大模型研发 许主洪  阿里通义 多模态大模型 人工智能 第4张

▲许主洪在讲解统一多模态模型产业发展脉络

许主洪指出,统一理解与生成的多模态大模型面临诸多技术挑战在全模态交互方面,目前支持音、视、图、文全模态交互的公开单模型极少;在理解与生成统一方面,图像和语义的理解生成统一模型罕见,且理解与生成效果难以均衡。

而在6月的演讲中,许主洪还表示:“多模态Agent AI时代刚起步,未来要实现AGI,我们需攻克众多技术难题,包括多模态大模型的基础能力、Agent智能体的核心功能模块、数据世界的连接与操作、物理世界的交互与控制等,挑战重重,但这也是未来多模态大模型行业的机遇。”

截至目前,阿里巴巴及许主洪方面尚未对此事作出评论。