国内大模型领域再次传来震撼消息。
在OpenAI发布其开源模型gpt-oss-120b仅仅5天后,8月11日,百川智能正式推出了开源医疗增强推理大模型Baichuan-M2。这款参数量达32B的模型,是百川智能开源的第二个医疗增强大模型,专为真实世界的医疗推理任务而设计。
值得注意的是,在OpenAI官方发布的权威医疗评测集HealthBench上,Baichuan-M2的综合成绩不仅超越了OpenAI自家开源的120B模型gpt-oss-120b,更一举登顶,成为开源领域最接近GPT-5医疗能力的标杆模型。
这无疑标志着中国医疗AI正迈入全球技术领先之列。
Baichuan-M2的发布,标志着百川智能在“用大模型造医生”的道路上迈出了关键一步。其核心技术突破在于,通过技术创新显著提升了AI医生在复杂诊疗场景中的思维与沟通能力,使其更贴近真实医生的专业决策与互动方式,为“AI医生”的最终实现奠定了坚实基础。
在HealthBench测试中,Baichuan-M2超越了gpt-oss-120b、Qwen3-235B-A22B-Thinking-2507、DeepSeek-R1-0528、GLM-4.5、Kimi-K2等开源模型。
特别是在HealthBench Hard任务上,Baichuan-M2展现出其在解决复杂医疗场景任务上的卓越能力。
此外,与当前行业前沿的闭源模型相比,Baichuan-M2亦毫不逊色:在HealthBench和HealthBench Hard上超越了o3、Grok3、Gemini 2.5 Pro、GPT-4.1等众多顶尖模型,且仅与GPT-5在Healthbench上得分超过32分。
评测结果数据是技术领先性的重要标志,但行业同样关注AI在真实医疗场景中的实际应用能力。
首先,医疗健康行业涉及个人隐私信息,对私有化部署有强烈需求。针对这一点,Baichuan-M2以极低的部署成本在HealthBench上取得了优秀效果。相比于OpenAI最新开源的gpt-oss-120b,Baichuan-M2进一步提升了模型的落地可能性与可扩展性。
此外,在中国本土医疗场景中,Baichuan-M2展现出比国际模型更精准的临床适配性。在中国临床诊疗场景的问题评测中,对比gpt-oss系列模型,Baichuan-M2展现出更明显的可用性优势,这一优势部分源于其对中国医疗场景的深度适配。
例如,面对一位55岁肝癌患者的复杂病例时,Baichuan-M2基于中国卫健委《原发性肝癌诊疗指南》推荐“解剖性肝右叶切除”方案——这与国内临床实践完全吻合。而同样的案例,gpt-oss-120b则建议“经动脉化疗栓塞术(TACE)”,显示出对中国诊疗规范的理解偏差。
从优秀的评测表现到更强的场景落地能力,百川智能凭借Baichuan-M2树立了医疗大模型的新标杆。
优秀医生的培养与供给是医疗行业的巨大瓶颈。
围绕这一方向,百川智能的解决方案是运用大模型智能体提供近乎无限的AI医生供给,通过与真人医生协作实现“双医模式”——让每位医生拥有AI医助,每位患者拥有专属的AI医生,并长期记录个体健康数据。
然而这一愿景的实现并非一蹴而就,需要逐步攻克诸多核心挑战。
行业层面,AI医疗面临数据来源广泛、格式与标准不统一、存在缺失或错误值等难题。此外,AI模型自身“黑箱”特性导致因果关系难以清晰呈现。
为此,百川智能于今年年初发布了Baichuan-M1-14B,作为行业首个医疗增强开源模型。仅隔半年,Baichuan-M2的发布便实现了更进一步的突破。
在真实的临床医患对话场景中,患者的表达往往具有种种噪声。比如症状描述因个体认知差异带有偏见或是遗漏。这对传统基于规则匹配的强化系统构建提出了严峻挑战。
Baichuan-M2的破局点在于为医疗构建强大的可验证系统时引入了“患者模拟器”。
“患者模拟器”是百川智能于今年1月在arXiv上发布的基于真实病例构建的AI系统。该系统如同自动驾驶的仿真测试平台,通过真实数据构建上万个不同年龄、性别、症状的AI患者,模拟了数百万次诊疗过程,从而生成出具有不同教育背景和表达能力的虚拟患者。
验证系统则通过动态生成评分标准,在端到端强化学习中实时优化AI医生的决策质量。
这些创新为医疗领域的强化学习构建了一个可验证的系统,并大幅提升了模型在复杂临床环境中的适应性与决策质量。
当前,全球AI竞争格局正经历深刻变化。
一方面,美国巨头如OpenAI、Anthropic等在通用大模型架构(如MoE)、路由机制、评测体系上持续创新。这导致中美在通用能力上的差距并未缩小,甚至还在拉大。
另一方面,医疗作为关键垂直领域正成为全球AI新势力追逐的核心赛道。例如OpenAI在GPT-5发布会上重点展示其在医疗健康领域的突破。资本亦闻风而动。据悉,美国新晋AI独角兽中医疗AI公司占比已超过50%。
“未来十年内借助AI高质量的医疗建议将随处可得。”比尔·盖茨于今年3月作出此番预言。
“AI将在多个领域发挥举足轻重的作用。”图灵奖得主Hinton在今年6月强调,“在医疗领域AI将成为每个人身边的‘私人医生’。”
站在这一维度审视百川智能此次开源Baichuan-M2不仅是一次技术成果的展示更是中国AI产业在医疗这一关键领域实现全球并跑的有力证明:
当OpenAI发布其开源医疗模型gpt-oss-120b后短短5天内百川智能便以Baichuan-M2做出“技术回应”并在权威评测中实现反超展现出中国团队在大模型领域的技术敏锐度与执行力。
“目前中国团队已与国际巨头并肩同行。”
本文由主机测评网于2026-04-21发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260439330.html