《自然》杂志最新发表的研究揭示了自主医疗AI智能体能力上的重大飞跃:两个独立的AI模型在患者管理的全过程,从诊断到治疗决策,均能提供关键支持。这两个系统,分别是德国的MIRA和谷歌的AMIE,目前在表现上至少已达到人类内科医生的水平,凸显了对话式AI工具在疾病管理中的潜力。

海德堡大学医院团队介绍了MIRA。该AI模型能够接入独立的电子病历系统,获取患者数据。研究人员通过500多例急诊科真实临床病例对MIRA进行了评估。结果表明,在与患者AI智能体进行对话并收集信息后,MIRA的回应与临床记录中的病史记录高度一致。MIRA能够从超过85000个选项中进行选择,以规划诊断测试、解读结果并制定治疗计划,包括开具处方、安排手术以及办理入院手续。其平均诊断准确率为87.8%,而由六位跨学科医生组成的专家组的准确率为78.1%。研究团队总结认为,未来需要进一步研究以提升准确性,并在实际应用中验证其泛化能力。

谷歌团队则推出了AMIE,一个为临床管理和对话优化的大语言模型系统。该模型能够对多次就诊的数据进行连续推理,从而跟踪疾病进展和治疗反应。AMIE借助谷歌Gemini分析从患者处获取的信息,并确保其输出结果与相关且最新的临床实践指南以及药物目录(包含经批准且临床首选的药物清单)保持一致。

在一项虚拟临床检查研究中,AMIE与21名全科医生进行了对比,涵盖了100多个就诊案例场景以及五个医学专科领域。这些场景的设计旨在反映英国国家卫生与临床优化研究所的指导方针以及《英国医学杂志》的最佳实践指南。在推理和管理能力方面,AMIE的表现与真实医生相当;而在治疗和检查的精准度、对临床指南的遵循程度以及基于指南制定管理方案的合理性方面,AMIE均超越了医生。在最新推出的药物推理基准测试中,AMIE在处理复杂病例时也表现优于医生。研究团队指出,AMIE代表了利用对话式AI工具协助医生进行疾病管理的一个重要里程碑。

大型语言模型在临床领域的应用前景广阔,尽管以往它们多专注于特定任务。然而,患者的临床管理需要一种多方面的综合方法,这包括深入了解病史、进行适当的检查、准确诊断、规划治疗方案、确定药物剂量、安排手术进程,以及在多次就诊中持续监测治疗效果。如果AI智能体能够胜任这些任务并实现有效的管理,它们将能成为人类医生的有力助手,承担日常的常规工作,甚至可能有助于缓解全球部分地区内科医生短缺的困境。