
图片来源:视觉中国
一位三甲医院的医生,最近两个月感受到了职业生涯以来最大的“沟通危机”。
“上午看了 30 个号,25 个病人是带着 AI 结论来的。”这位医生的语气里透着无奈,这种前所未有的变化令他十分头痛。
诊室沦为辩论场:大模型“幻觉”引发的信任危机
由于通用大模型无法根除的“幻觉”问题,AI 给出的医疗判断常常与医生的实际临床诊断相左。
本该是建立在信任基础上的诊室,如今却变成了高频拉锯的辩论场:“AI 说我这可能是罕见病,它真的是吗?”、“为什么你和 AI 说的不一样?”、“AI 建议开那种药,为什么你开这个?”、“AI建议我做的检查,为啥你没开?”……
这种患者面对主治医生掏出手机,展示一段大模型生成的诊断建议的就医行为,正成为一种愈发常见的社会现象。数千万用户在各类通用大模型中输入病症,寻求某种确定性的宽慰。
然而,通用大模型本质上是基于概率预测的“数字诊断”。因为它难以规避虚假信息与逻辑断裂,正将医患双方推向认知矛盾的深渊。这导致医患之间的沟通发生了质变——它沦为一场医生的疲惫自证,处处彰显着患者对医生权威性的挑战、质疑和不信任。
从“错位闹剧”到“新范式”:AI 医疗的破局曙光
但 AI 医疗难道注定是一场错位的闹剧吗?答案并不全然如此。
不久前在清华大学举办的“AI医疗新范式”论坛上,五位中国工程院与中国科学院院士、多位顶级三甲医院院长以及百川智能创始人王小川,提供了多个已经颇具泛化前景的应用场景实例。

“我们要造100万个儿科医生”---北京儿童医院倪鑫
儿科资源极其匮乏,三甲医院专家号“一号难求”。北京儿童医院院长倪鑫在论坛上提到,通过整合数百位专家的临床经验与数千万篇医学文献,医院与百川智能联合打造的AI儿科医生“福棠・百川”在专家会诊符合率上已达到95%。
团队现在立下一个极具冲击力的目标,要跟百川合作利用AI造出“100万个儿科医生”。对于一个长期受困于儿科资源短缺的国家来说,这意味着三甲医院的诊疗逻辑可以通过数字底座下沉到偏远县城。

“肿瘤患者把陪伴 AI 当成了"活生生的人"来交流。不会跟医生说的话,他会跟陪伴 AI 说。”---中国医学科学院肿瘤医院李宁
在中国医学科学院肿瘤医院(东肿),AI展现出了另一重人性的价值。在李宁副院长分享的一项临床研究中,100多名肿瘤患者在16周内将百川的“陪伴AI”视为真实存在的心理支柱。这些心理防线极高的患者,更愿意对AI倾诉那些难以对家人开口的恐惧。
7000余场连续对话证明,当医生想要人文关怀却苦于没有时间,AI精准填补了那块被忽视的情感空白。而在漫长的病程管理中,这种持续性关怀本身就是一种治疗。

“30城,5万人次,超25%的高风险检出率”---上海瑞金医院瞿介明
30个城市的实测、5万人次的筛查、超25%的高风险检出率,这种效率是纯人力模式无法想象的。
“给每个中国家庭都配备一个AI家庭医生。”——百川智能王小川

如果说上述三个是AI医生在专业领域的落地,“百小医”则是AI家庭医生的代表,百川智能创始人、CEO王小川提出了一个极具穿透力的“双医模式”:将用户的就医行为拆分为5%的关键决策与95%的全生命周期管理。
5%的关键临床决策,包括下诊断、开处方、手术操作,这部分必须由真人医生掌控,以应对复杂的生命个体与法律责任;剩下的95%,包括从发病时的初步分诊、就医前的病史梳理、诊后的药效观察到长期的生活方式管理,这些在现有的医疗体系中几乎处于真空状态,而这也正是百小医可以发力填补的部分。
百小医不但接手了医生看不见、来不及管的碎片时间,还可以通过微信生态统一管理家人健康,从手机里的一个聊天框,真实转变为一个下沉到千家万户的“居家级入口”,在中国原有三级诊疗体系之下,重新构建了一个永不下班、永不疲倦的家庭医生层级。
今天的问题已经不再是AI是否可以增加医疗供给,而是应该以何种方式入场,真正改变、影响每个人的生活。
AI 进入医疗,必须依靠医疗增强大模型
在前述论坛上,在场专家的一个核心观察是:通用大模型在生产与创造时颇为天才,但在面对严肃医疗时,往往因为幻觉一本正经胡说八道。
《BMJ Open》2026年的研究系统评估了主流通用模型的医疗回答,约50%被评为“有问题”,近20%属于“高度有问题”。
医疗对大模型有着近乎苛刻的刚性要求——低幻觉、强循证、会提问,而目前的通用大模型还无法完全达标。任何一位受过专业训练的医生,都不会在患者陈述第一句话后就下结论,但通用模型往往缺乏追问的能力,它们更倾向于给出一个看似逻辑圆满实则危险的猜测。
这种技术缺陷直接导致了医疗资源的二次损耗。医生不得不花双倍的时间去纠正AI的错误,这直接戳中了中国医疗最痛的软肋:优质资源稀缺,且效率低下。
为解决这一问题,百川展示了全新Baichuan-M4医疗专用大模型的实力。依托原创的事实性感知强化学习算法,将裸模型的事实性幻觉率降至全球最低的3.3%。在循证路径上,M4 将海量的权威医学指南拆解为上千条原子化临床路径,每一条均由顶尖临床专家定义与校验。在问诊层面,M4的深度问诊能力大幅领先最强通用大模型,不仅能像临床医生一样步步追问,更拥有超长记忆,足以托起患者长周期的健康管理。叠加 Harness 调度、记忆与自进化能力后,M4 已从"最强大脑",升级为最强医疗智能体。
正如论坛现场四位院士与王小川的发言中所说:AI 不替代医生,但需要以专用模型、深入临床、真实验证的方式进入医疗。
回归医疗本质,它始终是一场关于责任的契约。在AI尚不能替代医生决策的当下,它可以让医生从繁杂的琐碎中抽身,把注意力回归到那决定生死的5%的时间。
在这场AI推动的医疗变革中,那些曾因医疗资源匮乏而求助无门的偏远县城与农村的患者,那些深夜被病痛折磨的人们,终将有底气拿起手机提问,而他们得到的也不再是充满幻觉的猜测,而是真正值得信任的指引。


