AI又一次突破,同时确诊了10种类型的痴呆症,将人类医生的准确性提高26%
前言
痴呆症现在是世界人口死亡的第七大原因,也是世界老年人能力丧失和依赖他人的主要原因之一。精确诊断痴呆症有利于老年人晚年的身心健康,减轻家庭负担。
现在,一个由波士顿大学研究团队及其合作者开发的人工智能(AI)工具,有望帮助我们(同时)诊断 10 各种各样的痴呆症,提高了神经科医生的准确率 26% 以上。
有关研究论文以“AI-based differential diagnosis of dementia etiologies on multimodal data“问题,Nature已经在网上发表在科学期刊上。 Medicine上。
"我们的生成式 AI 该工具可以利用常规收集的临床数据对痴呆症进行鉴别诊断,展示其作为阿尔茨海默病及相关痴呆症可扩展诊断工具的潜力。“本文的通信作者,波士顿大学 Chobanian & Avedisian 医学院医学副教授 Vijaya B. Kolachalama 博士说道。
“世界上没有足够的神经专家,要求他们帮助的患者数量正在迅速增加。这种不匹配给医疗行业带来了巨大的压力。研究小组认为 AI 能帮助医生更有效地管理病人,通过早期识别这些疾病,避免病情恶化。”
研究小组希望未来, 预计20年痴呆病人数将翻一番,这一数字 AI 该工具能提供准确的鉴别诊断,并支持对痴呆症的有针对性治疗。
临床医师诊断准确率提高26%
依据世界卫生组织(WHO)目前,世界上给出的数据已经超过了 5500 成千上万的人患有痴呆症,每年全世界都会增加1000万个痴呆症病例,但是不同形式的痴呆症和症状的重叠可能会使诊断复杂化,从而无法提供有效的治疗。
因此,准确诊断痴呆症对于制定具有高度可操作性和个性化的管理模式尤为重要。然而,现有诊断工具的获取受到限制,神经学家和神经心理学家的短缺进一步加剧了这一挑战。
有鉴于此,研究小组开发了一种多模态机器学习(ML)框架,该框架采用常规收集的临床数据(如人口信息、患者及家庭病史、用药状况、神经和神经心理学检查分数、 MRI 准确识别引起痴呆症的实际病理,如扫描等神经图像数据。
图 | 病因分类术语表
利用从各种序列中获得的多模态数据,研究团队模型选择严格的方法来鉴别和诊断痴呆症。通过神经病学家团队的共识,将个人分配到十三个确诊类别中的一个或几个。这一实用分类方法旨在考虑临床管理路径,从而反映现实世界的情景。例如,研究小组将路易体痴呆和帕金森病归类为 LBD 综合类别。基于对这些疾病的理解,这种分类一般遵循类似的方法,通常由多学科的运动障碍专家团队监督。
图 | 九个单独的数据集
这项研究使用了九个单独的数据集,包括 ADNI、NACC、NIFD、PPMI、OASIS、LBDSU、4RTNI和 FHS。NACC、NIFD、PPMI、OASIS、LBDSU 和 4RTNI 用于模型训练的数据。ADNI、FHS以及 NACC 在模型测试中使用了一个保留集数据。多模态在本研究中 ML 从九个不同的全球数据集中使用50,000人的数据进行训练。
图 | 资料,模型结构,建模策略。a,痴呆症鉴别诊断模型采用多种数据模式开发,包括个人人口数据、健康史、神经检测、身体/神经检查和多序列MRI扫描。当可用时,这些数据库从九个单独的数据中总结出来。研究小组合并了模型训练。 NACC、AIBL、PPMI、NIFD、LBDSU、OASIS 和 4RTNI 的数据。研究小组使用 NACC 内部测试是数据集的子集。研究小组使用了外部验证。 ADNI 和 FHS 序列。b,Transformer 这是一种模型架构。通过模态特定的嵌入,每一个特征(emb.)将策略处理成固定长度的向量,并提供给输入。 transformer。使用线性层进行处理 transformer 连接到输出预测层。c,随机抽取 NACC 对测试数据集的一个子集进行对比分析,比较神经科医生。 AI 模型辅助下的表现和未使用 AI 协助时的表现。与此同时,研究小组对神经放射科医生进行了比较评估,他们得到了 NACC 检测队列中随机抽取的确诊痴呆症病例样本进行评估 AI 加强对其诊断表现的影响。模型和临床医生可以在这些评估中访问相同的多模态数据。最后,研究小组通过比较进行比较 NACC、ADNI 和 FHS 用生物标志物档案和病理等级来评估队列中模型的预测结果。
图 | 区分认知状态模型性能
该模型能有效地区分正常认知、轻度认知障碍和痴呆症,完成微平均值 AUROC 为 0.94表明其预测能力很强。该模型对不同年龄、性别和种族的个人具有一致性,证明其具有良好的泛化能力。该模型在处理缺失的数据方面表现良好,即使数据不完整,也能保持可靠的预测结果。
图 | 区分痴呆病因模型性能。
可区分模型 10 阿尔茨海默病、血管性痴呆、路易体痴呆等各种痴呆的原因已经完成。 AUROC 为 0.96表明其在病因诊断方面具有高度的准确性。该模型在处理混合型痴呆症(即多种原因共存)方面表现良好,平均值 AUROC 为 0.78,证明它能识别复杂的病因组合。该模型与生物标志物检测结果一致,并通过尸检验证了其与不同蛋白质疾病的关系,进一步验证了该模型的可靠性和准确性。
图 | 提高临床医师诊断效率模型性能
随机抽取 100 在案例中,使用 AI 模型协助神经科医生评估。 AUROC 与单独使用神经科医生进行评估相比 AUROC 高出 26.25%表明模型可以提高临床医生诊断痴呆症的准确性。模型预测结果与神经科医生和神经放射科医生的评价结果高度一致,表明模型可以提供可靠的辅助诊断信息。
不足与展望
研究数据主要来自白人群体,对其他种族和族群缺乏代表性。这可能会导致模型在处理不同人群时出现偏差。数据集中包括许多 AD 这种情况可能会使模型更倾向于识别。 AD 亚型,而忽略了其它痴呆亚型的特点。
虽然这个模型可以识别不同的痴呆亚型,但是它没有充分考虑 AD 病理学的异质性。今后的研究需要更深入地分析不同 AD 亚型特征,并对模型在这些亚型上的表现进行评估。
该模型将轻度、中度和重度痴呆症合并为一个类别,这可能不能完全反映特定医疗环境中对疾病阶段的详细评估。未来的研究可以选择将疾病阶段作为一个额外的维度来提高模型的准确性。
模型训练数据可能反映了不同临床医生诊断决策的主观性和差异,可能会影响模型的准确性。为了进一步提高模型的稳定性,未来的研究需要收集更加一致和规范的诊断数据。
未来,研究小组表示,为了提高模型泛化能力,可以尝试收集更多来自不同种族、族裔和临床环境的患者数据。通过改进模型结构,开发可以更好地处理它 AD 结合更复杂的神经网络结构或更细致的特征提取方法等病理异质模型; AI 为了获得更全面的病人信息,模型与脑电、基因检查等其它技术相结合,进一步提高诊断的准确性;另外,还可进行长期随访研究,跟踪患者的疾病进展及治疗效果,评估模型的预测能力,并验证其在临床实践中的价值。
论文链接
https://www.eurekalert.org/news-releases/1050605
https://www.nature.com/articles/s41591-024-03118-z
https://www.who.int/zh/news-room/fact-sheets/detail/dementia
本文来自微信微信官方账号“学术头条”(ID:SciTouTiao),作者:马雪薇,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com