无论模型如何更迭,能否被医生群体大规模采用,才是AI真正渗透医疗保健的关键。
这揭示了一个关键现实:医生并非抗拒技术,而是渴望真正可用、可靠、可及的AI工具。
这是继上周发布并开源最强医疗大模型Baichuan-M3后,又一次重大的升级。
新模型在幻觉控制能力上进一步提高,幻觉率降低至2.6%,刷新了M3所创下的世界纪录。
不仅如此,新模型使用成本进一步降低,仅为上一代M2 Plus的30%,扫清规模化应用障碍。
更加惊喜的是,百川宣布,全面开放M3 Plus的技术能力,API限时免费体验15天,所有开发者均可申请使用。
并且,百川正式发起「海纳百川」计划,面向所有为医务工作者提供服务的机构,免费提供M3 Plus的API。
这意味着,公司选择将全球最强的医疗AI能力交付给更多的生态伙伴,向行业打开了一个共赢的未来。
百川智能创始人王小川表示:“我们希望让更多人有机会体验并受益于当今全球最先进的大模型技术,让医疗行业这片‘大海’依托‘百川’的先进能力,全面提升医学服务水平。”
凭借极致的性能优化与普惠的开放精神,百川正在打通顶尖模型与真实诊疗场景的最后一公里。
像deepseek、豆包这样的通用大模型,存在大量的幻觉,无法让医生建立信任。
去年发布的Baichuan-M2 Plus,百川首创了“六源循证”,将循证医学范式引入模型。
直接结果是,M2 Plus的幻觉率较通用大模型显著降低,仅为deepseek-r1的1/3,比肩资深临床专家。
团队首创了一套事实感知强化学习(Fact-Aware RL)架构,使得M3在不依赖任何外部工具的情况下,幻觉率降至3.5%。
本次推出的M3 Plus,在M3的底座上,融合了M2 Plus的灵魂——六源循证。
要么是文献本身正确,但被引用的段落与结论并不匹配,甚至存在拼接、误读(内容冲突)。AG真人官方入口
让模型只能在“确实有证据支持”的空间中推理与生成,“引用正确性”被内化到模型训练的始终。
最终,结论与证据段落的匹配准确率超过95%,真正让AI的医学判断做到可核验、可追责、可教学。
M3 Plus直面这一挑战,在不牺牲性能的前提下,将综合使用成本较上一代降低了70%。
所有这些努力,最终指向一个目标:让强大的医疗AI,用得起、跑得快、落得下。
这款AI产品不接受互联网信息,只在专业医学期刊的高质量数据上训练,从源头上减少了幻觉问题。
短短几年,OpenEvidence便创造了医疗APP史上的增长神线%的美国医生使用OpenEvidence,每年超过1亿美国人接受了医生使用OpenEvidence进行治疗。
就在昨天,OpenEvidence宣布完成2.5亿美元D轮融资,最新估值达120亿美元。
在医学信息爆炸式增长的今天,一款可靠、好用的AI助手,是医生群体的“必需品”。
瞄准这个痛点,百川不断实践,探索出一条更加符合中国国情的医疗AI落地之路。
凭借独创的六源循证技术与M3基座结合,M3 Plus将幻觉率降低至2.6%,优于Open Evidence。
免费提供M3 Plus的API,将全球幻觉最低的循证增强医疗大模型开放给整个医疗行业。
这意味着更多医疗机构、开发者可据此快速开发出适合自身需求的医疗AI应用。
团队对此有深刻理解,选择用极致的技术透明和普惠精神,让大模型与医生、医院建立合作信任。
王小川表示,希望通过免费、持续且长期的使用,让行业伙伴能够更加安心地探索与尝试,深入理解各类应用场景,最终为患者带来福祉。
1月8日,OpenAI推出了旗下首款AI医疗产品ChatGPT Health,允许用户将医疗记录和健康应用连接至AI,打造“个人超级健康助手”。
1月11日,Anthropic官宣Claude for Healthcare,瞄准整个医疗系统、保险、患者、乃至上游药物研发等各个环节。
1月13日,谷歌发布最新开源医疗模型MedGemma 1.5,在多模态应用上实现重大突破。
AI巨头布局医疗健康的动作明显加快,印证了王小川之前的判断:医疗正迅速从「非共识」走向「共识」。
一路走来,百川持续深耕医疗这一高度垂直的领域,在底层模型上具备深厚积累,并持续探索医疗AI落地路径。
通过开放合作构建宽广的创新生态,将蛋糕做得更大,最终带动整个行业的繁荣,是百川智能作为领军者的战略远见。
站在AI深度融入医疗健康的关键节点,百川愿与上下游合作伙伴深度协同,共同加速“天下无病”的到来。
