1月22日,百川智能正式发布Baichuan-M3 Plus,严肃医疗场景下的问答准确性、可靠性,再次刷新了刚刚推出的M3所创下的世界纪录。凭借独创的六源循证技术与M3基座结合,M3 Plus将幻觉率降低至2.6%,低于Open Evidence。
当前行业中,无论是通用大模型还是医疗模型,大多已支持“文献引用”——在结论后标注论文或指南来源。但在实际使用中,医生往往会发现:点开引文,依然无法判断AI的这句结论究竟源自哪一段证据。更常见的问题是两类:一是“张冠李戴”,引用编号存在,但文献内容对不上;二是“内容冲突”,文献本身正确,但被引用的段落与结论并不匹配,甚至存在拼接、误读。
百川M3 Plus首创“证据锚定(Evidence Anchoring)”技术,不是简单标注“引用自哪篇文献”,而是要求模型生成的每一句医学结论,都必须精确对应到原始论文或指南中的具体证据段落。每一句判断,都能被逐字溯源、逐条核验。
为实现这一目标,百川将“证据锚定”作为独立训练目标,引入Citation Reward Model,对错误引用进行明确惩罚,让模型只能在“确实有证据支持”的空间中推理与生成。最终,结论与证据段落的匹配准确率超过95%,真正让 AI 的医学判断做到可核验、可追责、可教学。
更具意义的是,百川宣布推出海纳百川计划,将循证增强医疗大模型M3 Plus以API形式,免费开放给中国医疗服务机构,共同繁荣国内的AI医疗生态,推动中国AI医疗的变革,让每一位中国医务工作者都能拥有可靠、好用的AI助手。
文/广州日报新花城记者:张露
广州日报新花城编辑:李光曼