德国癌症研究中心的研究人员开发了一种人工智能模型Delphi-200M,可以预测一个人使用医疗记录在未来长达二十年的1000多种疾病的风险。这种发展与从反应性治疗转变为主动预防的医疗保健方面的更广泛转变相吻合。尽管已经创建了算法来预测单个疾病的风险,但疾病通常相互联系。一个可以解释这种复杂性的综合模型可以为早期治疗,改善目标筛查并识别可能被忽视的高风险个人。
delphi-200亿的工作方式
Delphi-200m模型是一种大型语言模型(LLM),类似于文本生成聊天机器人背后的技术。它没有接受互联网文本的培训,而是通过从英国生物库来处理超过40万个综合医疗记录来开发的。这些临床数据补充了生活方式信息,例如体重指数和吸烟状况。该模型将患者的病史视为“疾病令牌”的序列,其中每个诊断代码代表了潜在疾病进展的一步。通过分析这些序列,AI了解了随着时间的流逝,不同条件如何连接并互相跟随的统计模式。一个关键特征是它可以动态重新评估预测的能力。当添加新信息(如最近的血液测试结果)时,该模型可以更新该人的风险计算,从而可以进行持续的健康监测。
性能和验证
在绩效评估中,Delphi-200万匹配或超过了培训的1,258种疾病中的大多数临床风险评分的准确性。它还优于其他专门的医学AI预测因子,该预测因素旨在预测单疾病。事实证明,该模型在预测心血管疾病和痴呆症的长期风险方面特别有效,即使预测未来二十年,也比某些基于生物标志物的模型显示出更高的准确性。但是,该模型努力通过更大的轨迹(例如2型糖尿病)的重大影响来准确预测轨迹。这表明其能够说明在电子健康记录中未持续捕获的因素的能力。为了测试其鲁棒性,研究人员将该模型应用于丹麦国家患者登记处,其中包含近200万公民的记录。尽管人口和医疗保健系统的差异差异,但该模型的预测准确性仍然很高,这表明它学习了人类疾病进展的基本原理。
道德设计和未来应用
Delphi-200M的设计考虑了实用和道德的考虑。它可以从合成病历中学习以保护患者隐私,并且是一种“可解释的” AI,这意味着它可以通过聚类相关的疾病和症状来为其预测提供理由。研究人员强调,该模型确定了统计关联,而不是因果关系。该模型是通过模块化设计构建的,可以在将来结合其他数据类型,例如基因组学,诊断成像和可穿戴设备的数据。目前,该工具正在其他人口不同的国家进行测试。以目前的形式,它可以在临床环境中使用,以识别即使不符合传统标准,他们也会从早期筛查中受益。
专家接待
该模型已被未参与研究的专家积极接受。 Anglia Ruskin University的教授Justin Stebbing称该工具为“成就”,该工具为“预测准确性和可解释性的新标准”设定了。伦敦国王学院的研究员古斯塔沃·苏德雷(Gustavo Sudre)将这项研究描述为:
“迈出了可扩展,可解释且最重要的是医学中预测性建模的负责任形式的重要一步。”





