当前位置:首页 > 科技资讯 > 正文

微软AI首秀自研大模型,未来无限可能

微软AI首次亮相自研大模型,未来技术引领潮流!

智东西8月29日报道,今日,微软旗下的AI研究机构微软AI(Mircosoft AI,简称MAI)发布了其首批两款全自研AI模型,分别为MAI首款端到端训练的基础模型MAI-1-preview和首款语音生成模型MAI-Voice-1

值得一提的是,MAI-Voice-1的发布正值“铁盟友”OpenAI也发布了一款语音模型。MAI-Voice-1以其高保真、富有表现力的音频,已在Copilot Daily和Podcasts上线,并可在Copilot Labs进行体验。

在智东西进行的实测中,这一模型展现了极高的定制化程度:用户不仅能选择情绪模式、声音模板,还提供了至少40种语体风格的选择。除了常见的情绪模板,模型还能扮演机器人、海盗、吸血鬼等不同角色,对同一段文本进行自主改写和演绎,可玩性超强。

每个角色都有独特的说话方式和口癖。例如,猫头鹰会不停地“咕咕”叫,机器人则带有一种“活人微死”的感觉,而新闻主播则一本正经。这些角色在统一声音模板的基础上展现出了极强的可塑性。

MAI-Voice-1的生成速度也相当快,微软称它能在单块GPU上运行,一秒钟输出一分钟的音频。然而,该语音模型目前暂不支持中文输出,输入中文时会自动转为英文。

微软AI首秀自研大模型,未来无限可能 微软AI  自研模型 MAI-Voice-1 人格原材料 第1张

输入中文文本后,也会自动转为英文。

体验链接:

https://copilot.microsoft.com/labs/audio-expression

MAI-1-preview是一款混合专家模型,它在约1.5万颗英伟达H100 GPU上完成了预训练和后训练,主打指令遵循和日常问题解答等功能。

尽管这一模型已在LMArena(大模型竞技场)内进行盲测,但智东西多次尝试体验却未能如愿。未来几周内,MAI-1-preview将应用于Copilot的部分文本场景以获取反馈并优化用户体验。

新模型发布之际,微软AI CEO Mustafa Suleyman还接受了媒体Semafor的深度专访,向外媒阐述了自研大模型背后的考量,并正面回应了外界关于微软与OpenAI关系渐行渐远的看法。

微软AI首秀自研大模型,未来无限可能 微软AI  自研模型 MAI-Voice-1 人格原材料 第2张

Mustafa Suleyman在微软发布会上(图源:微软)

MAI成立于2024年3月,是微软推进Copilot和其他消费者AI产品和研究的专门机构。Suleyman曾担任DeepMind联合创始人兼应用AI部门负责人一职,在DeepMind被收购后加入谷歌并在2022年离职创办大模型创企Inflection AI。

2024年初,Inflection AI与微软达成6.5亿美元“人才收购”交易方案,Suleyman与大部分员工加入MAI。仅仅14个月后,他们便交付了第一款自研模型。

Suleyman称,AI对微软的业务有根本性意义,而自研模型计划早在14个月前便已启动。他们会继续与OpenAI等企业合作并使用开源模型,但重要的是确保始终拥有选择权。

Suleyman将MAI-1-preview定义为“人格原材料”,这意味着该模型在融入产品的过程中能展现出各种不同的人格特点。通过后训练、提示词工程等方法,未来的大模型可以涌现出“数百万种”不同的人格

微软拥有打造强大模型所需的资源,正在构建世界上最大规模的GB200、GB300集群。但Suleyman强调规模固然重要,效率同样关键。这意味着要精挑细选高质量训练数据,让每一次浮点运算、每一次GPU迭代都物尽其用。

Suleyman还在访谈中分享了对“可解释性”研究的看法。他认为模型本质是空心的,可解释性研究有意义但并不会揭示所谓意识的本质

思考未来:自研模型的挑战与机遇