Delphi-2M:AI在医疗预测领域的突破
背景与需求
许多人一生中会罹患不止一种疾病,而预测不同疾病之间的相互影响一直是一个难题。在医疗决策领域,精准预测患者未来健康走向是核心需求。人工智能(AI)模型通过分析患者记录中的海量数据,可以帮助识别疾病的进展模式。然而,这些模型的潜力尚未被充分挖掘,尤其是在大规模人群层面。
Delphi-2M模型的提出
近日,德国海德堡德国癌症研究中心(DKFZ)肿瘤学AI分部等联合团队在《Nature》期刊上发布了一篇论文,提出了一项突破性的研究成果:Delphi-2M模型。该模型基于生成式预训练Transformer(GPT)技术,通过分析个人病历和生活方式,对1000多种疾病提供长达20年的潜在疾病风险评估,并生成保护隐私的合成数据,为个性化医疗和长期健康规划开辟了全新路径。
模型架构与训练
Delphi-2M的核心在于通过理解患者过去与当下的健康状态,预测未来疾病风险并进行干预。研究团队对GPT-2架构进行了“魔改”,通过正弦和余弦基函数对连续年龄进行编码,并在输出头中加入另一个模块,通过指数等待时间模型预测下一时间。该架构允许用户通过提供部分健康轨迹,计算出疾病及死亡事件的每日新增率,并根据这些速率对后续token及对应时间进行抽样,逐步完成完整健康轨迹的抽样。
数据集与验证
Delphi-2M的训练与验证依托内、外两大高质量数据集,确保模型的泛化能力与可靠性。训练数据主要来自英国生物样本库的40万名参与者,涵盖ICD-10顶级诊断代码、性别、体重指数(BMI)、吸烟/饮酒习惯及死亡信息。内部验证数据为英国生物样本库剩余20%参与者(约10.2万人),用于模型超参数优化;同时选取47.1万名2020年7月1日仍存活的参与者,追踪至2022年7月1日,验证模型的纵向预测能力。外部验证数据为丹麦全国疾病登记系统的193万国民数据,时间跨度从1978-2018年。
模型表现与优势
Delphi-2M近乎实现了“全谱覆盖”,可同时预测1256种疾病及死亡风险,且精准度表现出色。在英国生物样本库数据中,模型对多数疾病的年龄-性别分层AUC(受试者工作特征曲线下面积)平均达0.76,97%的疾病AUC超过0.5。死亡风险预测的AUC最高,男女均达0.97。与临床工具进行对比时,Delphi-2M在预测心血管疾病、痴呆和死亡风险方面表现出色,仅在糖尿病预测上略逊于临床金标准HbA1c。
跨人群泛化能力
Delphi-2M在跨人群泛化能力的表现也较为优异。应用于丹麦数据时,Delphi-2M平均AUC虽略低于英国数据,但疾病预测结果与丹麦人群实际发病模式高度相关,证明其在不同医疗体系下具备广泛适用性。
长期预测价值
不同于传统模型仅能预测1-5年的发病概率,Delphi-2M的“生成式”特性使其能模拟个体未来长达20年的健康路径。研究团队以英国生物样本库中60岁参与者为例,基于其60岁前的病史数据,生成未来健康轨迹,并与实际随访结果对比得出以下结论:
- 群体层面的吻合度较高。
- 个体风险区分清晰。
- 长期预测仍然有效。
隐私保护与合成数据
Delphi-2M可生成完全虚构的健康轨迹,复现真实人群的年龄-性别特异性发病率模式,且无法通过合成数据反推真实的个人信息。因此,合成数据可作为真实数据的一种替代品,用于训练其他医疗AI模型,既能保护隐私,又避免了数据资源的浪费。
局限性与未来展望
尽管Delphi-2M表现突出,但研究团队在论文中也明确指出了其局限性:
- 存在训练数据偏差的情况。
- 无法建立因果关系。
- 仅通过数据拟合验证,尚未经过前瞻性临床试验。
未来,随着训练数据的多元化、验证场景的临床化等,Delphi-2M这类AI模型有望真正融入医疗流程,为每个人提供量身定制的健康管理方案,真正推动精准医疗从概念走向实践。