9月29日,据“互联网八卦小喇叭”等媒体透露,国际知名AI科学家、IEEE Fellow许主洪(Steven Hoi)现已加入阿里通义团队,专注于通义大模型的研发工作。
许主洪在AI领域拥有超过20年的产业和学术经验,现任新加坡管理大学终身教授,并曾担任新加坡南洋理工大学终身副教授。他在AI领域发表了300余篇顶级学术论文,被引用次数超过5万次,获斯坦福大学评为全球前1%的AI科学家。
作为多模态大模型领域的领军者,许主洪曾任职全球最大企业软件公司Salesforce的副总裁,从零构建了Salesforce在亚洲的AI研究生态系统;他还在2023年创立了多模态AI初创企业HyperAGI,堪称业界罕见的产学研多栖AI专家。
▲许主洪
2025年2月,许主洪加入阿里巴巴并担任集团副总裁、智能信息事业群首席科学家,向智能信息事业群总裁吴嘉汇报,负责AI To C业务的多模态基础模型及智能体(Agents)研究与应约。
按照原定规划,许主洪的核心任务包括组建顶尖AI算法团队,整合通义(应用)、夸克、天猫精灵等内部资源,推动多模态交互产品迭代,加速AI To C商业化进程。
在2025年6月的上海世界移动通信大会上,许主洪发表了题为《多模态大模型发展与演进》的演讲,其中以夸克App的AI超级框、AI相机等功能为例,阐述了多模态大模型的应用场景。
▲许主洪以夸克为例讲解多模态大模型应用场景
然而,在加入阿里7个多月后,许主洪据悉已加入通义实验室团队,这暗示他可能从面向AI To C的商业化研发转向更基础前沿的大模型研发。
如若消息确认,这将意味着阿里巴巴完成了一次重要的人才重新配置,也标志着其在多模态大模型研发领域再次加大投入。
当前,阿里通义大模型正处在“比拼迭代速度”、“多模态发展”的关键时期,急需许主洪这样对口、顶尖且具分量的产学研多栖AI专家领军。
在9月底的2025云栖大会期间,阿里云智能集团首席技术官、通义实验室负责人周靖人透露,连续发布数十款模型背后有战略考虑:全球AI模型进展加速,整个通义家族持续与全球AI领先者竞速,AI已进入加速期,核心是模型迭代效率;同时模型从单模态向多模态演进是必然趋势,阿里期待在多模态方面实现进一步创新与突破。
许主洪或许是当前阿里最适宜牵头此事的人选。他在今年5月蚂蚁技术开放日的演讲中提及,当前,采用统一框架进行理解与生成,是多模态大模型发展的重要趋势。但该领域仍处初级阶段,需实践验证。
▲许主洪在讲解统一多模态模型产业发展脉络
许主洪指出,统一理解与生成的多模态大模型面临诸多技术挑战。在全模态交互方面,目前支持音、视、图、文全模态交互的公开单模型极少;在理解与生成统一方面,图像和语义的理解生成统一模型罕见,且理解与生成效果难以均衡。
而在6月的演讲中,许主洪还表示:“多模态Agent AI时代刚起步,未来要实现AGI,我们需攻克众多技术难题,包括多模态大模型的基础能力、Agent智能体的核心功能模块、数据世界的连接与操作、物理世界的交互与控制等,挑战重重,但这也是未来多模态大模型行业的机遇。”
截至目前,阿里巴巴及许主洪方面尚未对此事作出评论。
本文由主机测评网于2026-01-05发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260114997.html