百川推出最低幻觉循证增强医疗大模型M3 Plus-格隆汇

百川推出最低幻觉循证增强医疗大模型M3 Plus

前天 19:33

9,170

首创“证据锚定”技术。

222图片1.png 首创“证据锚定”技术。

据IPO早知道消息，百川智能于1月22日正式发布 Baichuan-M3 Plus，严肃医疗场景下的问答准确性、可靠性，再次刷新了刚刚推出的M3所创下的世界纪录。

事实上，上周百川正式开源的M3大模型，不仅在 Healthbench、Healthbench Hard 等多个权威评测中登顶榜首，实现了对 GPT-5.2的全面超越，更在 OpenAI 引以为傲的低幻觉领域完成超越，以3.5%的幻觉率领跑全球。

作为百川拓展低幻觉技术路线的成功实践，M3首创的 Fact-Aware RL的强化学习范式，使底座模型在无工具的设定下，幻觉也能大幅降低到SOTA水平。在此基础上，M3 Plus 将 M2 Plus 模型已验证有效的六源循证范式，引入模型训练和推理过程，确保模型的每条建议都有专业医学证据支持。最终，M3 Plus的事实性幻觉降低到新的SOTA，仅2.6%，相较GPT-5.2大幅下降超30%。即便与行业标杆 Open Evidence相比，M3 Plus 也完成了超越。

222图片2.png 同时，百川 M3 Plus 还首创“证据锚定（Evidence Anchoring）”技术，不是简单标注“引用自哪篇文献”，而是要求模型生成的每一句医学结论，都必须精确对应到原始论文或指南中的具体证据段落。每一句判断，都能被逐字溯源、逐条核验。

为实现这一目标，百川将“证据锚定”作为独立训练目标，引入 Citation Reward Model，对错误引用进行明确惩罚，让模型只能在“确实有证据支持”的空间中推理与生成。最终，结论与证据段落的匹配准确率超过 95%，真正让 AI 的医学判断做到可核验、可追责、可教学。

222图片3.png 此外，M3 Plus 在系统层面也进行了全面的工程重构，通过 MoE 架构优化、模型量化以及 Gated Eagle-3 投机解码等关键技术，在严格保证模型能力与可靠性的前提下，实现了 API 调用成本较上一代降低 70%，为 AI 在医疗场景的规模化应用扫清了关键障碍。

更具意义的是，百川宣布推出「海纳百川」计划，将全球最低幻觉的循证增强医疗大模型以API形式，免费开放给中国医疗服务机构，共同繁荣国内的AI医疗生态，推动中国AI医疗的变革，让每一位中国医务工作者都能拥有可靠、好用的AI助手。

某种程度上而言，从核心技术的持续突破，到面向行业生态的免费开放，「海纳百川」不仅是一个名字，更是一份推动中国AI+医疗发展的承诺。百川愿与行业伙伴一道，围绕医生、面向患者，推动医疗 AI 更安全、更可及、更有温度地发展，让技术进步真正转化为人民健康的长期福祉。

本文为IPO早知道原创

作者｜Stone Jin

格隆汇声明：文中观点均来自原作者，不代表格隆汇观点及立场。特别提醒，投资决策需建立在独立思考之上，本文内容仅供参考，不作为实际操作建议，交易风险自担。

百川推出最低幻觉循证增强医疗大模型M3 Plus

相关阅读

评论