AI检查癌症,究竟是智商税吗?

06-25 21:18

有时,科学进步,背后常常有一种痛苦的催化剂,即使在AI领域也是如此。


例如,在地球的另一端,有这样一位老人,他一生中三次步入婚姻殿堂,但他不得不两次面对生命无法承受的沉重——前两任妻子,其中一人因乳腺癌的无情入侵,在漫长的斗争后悄然离世;另一个是在与胰腺癌的艰苦斗争中告别他。


但是,这种痛苦,却也在冥冥中,为他指明了一个新的方向。


这个老人,杰弗里·辛顿,AI三教父之一。



在辛顿以前的妻子接受治疗的过程中,他注意到传统的影像分析依赖于放射科医生的专业知识和经验,这通常需要时间,容易受到主观判断的影响。


所以,在接受2017年《纽约客》采访时,他指出,深度学习将会进行。5到10年内超出了急诊医生的诊断能力,并且认为AI系统可以比人类医生更准确地检查疾病,例如乳癌。


01坎坷的“看片”之路


尽管现在看来,放射科医生的饭碗依赖性很强,但在某种程度上,辛顿的愿望,确实部分实现了。


联合国于今年5月30日在瑞士日内瓦举行AI。 for 在Good全球峰会上,一段中国女性患者演奏口琴的视频引起了观众的关注。她是世界上第一位受益于AI胰腺癌早期筛查技术的黄女士。


去年四月,因为一点小咳嗽,我去医院做了一个常规的CT扫描。没想到这次扫描,黄女士居然去了医院。在早期被AI识别为胰腺癌。



而且医院之所以想到使用AI,是因为她的CT图像被列入其中。阿里达摩院“平扫CT”牵头 AI"早期癌症筛查项目。


回到医院复查后,AI的分析确实是正确的:胰尾真的有硬块!


使用对比剂增强扫描后,确定其大小为25。×大约31毫米。大约是这样一个中等大小的红提这么大。


正是因为发现早,并且很快就做了手术,黄女士才从胰腺癌这样的病例中获得。世界上存活率最低魔爪下的恶性肿瘤之一幸存下来。


一般而言,在被诊断为胰腺癌之后,只有大约5%的患者能够存活5年。


而且开发这种AI检测技术的,正是阿里达摩院医疗AI团队,以及它所建立的AI团队PANDA是胰腺癌检测模型。


问题是,癌症早期筛查为什么这么难?AI如何突破人类的极限,在很早的时候就被发现了?


首先,CT检测癌症疾病的原理是利用X射线获取人体内部的断层图像数据。


当X射线束穿过被检查的人体部位时,不同的组织密度导致X射线的衰减不同,从而在探测器上形成不同的衰减强度分布。


由于正常组织和病变组织(如肿瘤)的密度不同,如钙化、血管增生等,因此CT图像可以清晰地显示出来。


但是问题是,在大多数情况下,一些早期的细微疾病没有坏死、钙化、出血等,也没有引起明显的密度或信号变化。


再加上这些早期疾病的大小,大部分都是非常微妙的,大约在0.3到0.5毫米之间,通常处于常规CT分辨率的边缘(0.5-1毫米),这使得检测起来更加困难。


这样的话,更高级的增强CT就该出现了。


由于增强CT是在注射造影剂后进行的,造影剂往往含有碘或含有碘的化合物。由于原子序数高,这些成分对X射线或MRI(磁共振成像)的辐射具有不同于人体细胞吸收的特点。


因此,在造影剂的影响下,血管更加明显。那些血液供应异常的早期疾病(肿瘤往往有新生血管,血液供应更丰富)会在图像上更加突出。即使疾病本身很小,也很容易通过血流增强的差异来识别。


就像在一幅画中,用更深的色彩勾勒出原本模糊的轮廓,使细节更加清晰可见。


在这种情况下,以后遇到癌症筛查方面的事情,直接统一增强CT不是很好吗?


02 无法忍受的增强CT


在癌症早期筛查中统一使用增强CT是一个很好的想法,但是很不切实际。


最为重要的原因是,增强CT这个东西,成本实在太高了。


这里面的大头,首先是造影剂。一般造影剂的价格在300-400元左右,而对肾损伤较小的造影剂的价格可能接近700元。


因为造影剂不仅要在体内达到理想的显影效果,还要保证良好的生物相容性和低毒性。这对其分子设计和化学合成的技术要求极高。


技术难度大,能够生产的企业少。


由于专利保护的出现,造影剂市场缺乏有效的竞争。制药公司可以保持较高的定价水平。



资料来源:观研报告


此外,增强CT使用的设备比普通CT贵得多。例如,高档CT扫描仪通常配备更多的探测器排数,如64排、128排甚至256排。


更多的探测器意味着可以获得更详细的图像数据,但是相应的成本也会相应增加。


例如,一台只有16层的普通CT扫描仪,价格通常在30万到50万美元之间;而且有256层的高端CT扫描仪,价格在200万到300万美元之间。


如此昂贵的成本,带来了一个问题:在实际检测中,造影剂是按次消耗的,设备也会因使用次数而产生折旧费用,如果一般CT完全用增强CT代替,许多情况下会出现“大炮打蚊子”的情况,造成医疗资源的极大浪费。



毕竟对于癌症检测来说,医生建议增强CT的时候,通常是病情有明显症状的时期,比如持续性肿块、不明原因的体重下降、持续性疼痛等。


如果医生在没有明显症状的情况下遇到任何患者,都会优先考虑增强CT,那么如果最终检测到的结果不是癌症,而是假阳性或者一些小病呢?


白白浪费昂贵的医疗资源,还可能挤占真正需要这些检查的高危病人(已经出现明显症状)。


在医疗领域,这种困境或谬论被称为困境。“初步检验谬论”(Early Detection Paradox)。



在这种情况下,有没有一种方法可以将CT的技术优势与普通CT相结合,同时具有大规模推广的普遍性?


这个时候,AI和深度学习的不可替代的优势就显露出来了。


03 AI之力


上述阿里所采用的PANDA模型中,最重要的技术之一就是一种叫做PANDA的技术。“图像准确”该技术将对比增强CT上的病变标记“复制”到非对比CT图像上。


用直观的语言来形容,这种做法是:先找两张CT照片,一张是普通CT,一张是增强CT。之后,PANDA将增强CT上的病变区域准确地映射到普通CT的相应位置,通过“重叠”两个CT。


需要注意的是,这里的“重叠”并不是简单的物理重叠两张图片,而是通过算法识别两张图片中的特征,计算两张图片之间的关系。


用一个描述来解释,就像你有一个笔记本(增强CT),上面写着隐形墨水,只能在特定的光源(造影剂)下看到。


你看到的笔记本页面(一般CT)在常规光线下是空白的。


为了在没有特殊光源的情况下,AI还可以知道一般笔记本上的哪些区域,并且与原来隐形墨水写的内容相对应,AI应该首先将隐形墨水的显形内容复制到另一本普通笔记本上。



这样就相当于给AI一个“答案”,让它学会如何在只有普通CT的情况下识别病变。


这样,AI就可以结合增强CT高精度和一般CT低成本、便于大规模普及的多重优势,在筛查癌症时可以便宜准确。


但是问题是,这个过程看起来很简单,但是真正做到精通的团队并不多。


这里面的难点在于,如何在有限的模型参数下,提高AI对CT的识别精度。


这就像教一个人如何识别图片。理论上,戴上更好的眼镜(更强的识别模型)会直接有利于提高识别精度,但问题是更强大的模型通常意味着更复杂的结构和更多的数据。


但是在医学影像领域,高质量的标记数据特别稀缺和昂贵,很难得到。


更为重要的是,模型结构越复杂,其解释性就越低,决策过程就越不透明。


这种情况在医疗领域是一种禁忌,因为医生需要了解为什么模型会做出某种诊断,毕竟生命危险的事情不能靠概率来蒙蔽,对吧?


所以,在参数有限的情况下,通过将识别步骤拆分成三个不同的网络阶段,可以减少每一步的认知负荷,使识别过程更加有序和准确。


具体而言,在第一阶段,PANDA将采用nnU-Net模型——一种特定的深度学习结构,准确地识别和分割胰腺的区域。相当于用画笔画出胰腺的轮廓。


第二阶段,一旦胰腺区域被定位和分割,PANDA的联合分割和分类网络就会判断这些区域是异常还是正常。如果有异常,需要找到相应的病变区域。



第三阶段(Stage 3)- 病变亚型分类:在检测到病变后,这一时期的目标是对这些病变进行更详细的分类,例如区分不同类型的肿瘤或病变。


每一个阶段的专注学习,就像是在逐渐调整“眼镜”的焦距,让大脑(AI模型)能更清晰地看到和理解每一个细节。


04 AI早筛神器民间版本


说实话,尽管使用AI进行医学影像检查,早已是人类所期待的,但这项技术真正完善,却是最近两三年的事。


这就是为什么,在阿里在《自然医学》上发表了这一成就的论文后,很多审稿人并不相信这项技术已经成熟到足以超越人类,以至于质疑不断。直到后来,阿里在法兰克福节点创建了一个可操作的演示,他才消除了自己的疑虑。


然而,也许让这些审稿人更不敢相信的是,早在阿里推出PANDA之前,早在2018年,一位名叫coolwulf的中国“民间奇侠”就尝试使用它。50张1080Ti建立了一个初级的 GPU 计算集,检查乳腺癌。



coolwulf,本名姜浩。


本科及博士学位分别在南京大学物理系、密歇根大学核工程及放射科学系学习。


虽然主营业务是影像医学,但业余时间也是开源项目的程序员。因为我见证了我年仅一岁。 34 南京大学同学不幸去世,因为错过了乳腺癌的最佳治疗期。coolwulf开始意识到,乳腺癌很容易延误治疗,因为早期症状不明显。


因此,在悲伤的驱使下,具有编程天赋的coolwulf开始创建一个专门用于“看电影”的AI,让那些不能及时就医的患者提前了解病情。


coolwulf 姜浩( 右一 )


对于有很高编程天赋的coolwulf来说,编写相应的模型代码可以通过自学来处理。然而,对于一个弱小的个体来说,真正的困难在于数据与算率方面。


GPU的算率在coolwulf(2018年)建立这个项目的时期远不如今天发达,A100、像H100这样的算率专用卡还没有出现,当时coolwulf所能获得的最高GPU,就是显卡1080Ti,主要用于游戏。


而且即使是这样的显卡,由于当时挖矿潮的原因,coolwulf还是要和各行各业的黄牛和矿工斗智斗勇才能买到。



对深度学习而言,1080T最大的局限性在于缺乏特殊性。张量核心(Tensor Cores)。


那是后来的图灵(Turing)、安培(Ampere)GPU和Hopper结构引入的新功能。它大大加快了深度学习中常见的矩阵操作和张量操作,从而提高了练习和推理的速度。


第二,从显存来看,其11G显存,对于深度学习来说也确实太小了(A100是40GB HBM2),因为显存充足,在处理数据或复杂模型时尤为重要。



但是在数据方面,由于医疗数据包括个人信息,通常受到严格的法律保护,很多高质量的医学影像数据一般不公开,或者在使用之前需要经过层层审批。


对没有机构和大企业作为靠山的个人来说,获取这些信息是极其困难的。


因此,coolwulf 首先在佛罗里达大学官网下载 DDSM、MIAS 数据。并专门写了一个程序,将这些电影的长期翻拍数据转换成可用的形式,然后专门为巴塞罗那大学写了一封申请函,要求获取其非公开的乳腺癌数据。



MIAS 数据页面


尽管经历了这样的局限和困难,当coolwulf最终完成时, AI 对乳癌网站进行检查,并免费向公众开放,肿瘤识别的准确性,仍然达到 90%。


这样就足以证明当时对癌症检测的深入研究。


对于许多患有乳癌的病人来说,这种技术,相当于延缓了打开死亡之门的时间,是一种真正可以拯救生命的技术。


结语


虽然当时coolwulf搭建的AI检测平台在乳腺癌检测的准确性方面已经非常出色,但coolwulf也在其最新的AI检测项目中,本着与时俱进的精神,在计算率爆发的今天。——NeuralRad上,用4090代替GPU从1080Ti。


更加可贵的是,在计算率成本急剧上升的情况下,AI检测项目仍然是免费的。



至于为什么还坚持免费,用coolwulf自己的话来说,是因为他知道真正需要这项技术的患者通常都在医疗资源稀缺的地区。


在那里,我们不仅很难找到有经验的放射科医生,甚至由于缺乏电力,这些地区的医院也无法让放疗机和放疗机。 CT 同时工作。


这类地区,大多是一些贫穷的国家,贫瘠的地方。对于这些地区的人民来说,收费既不现实,也令人难以忍受。



甚至,考虑到这些地区缺乏硬件相关性。(GPU)在这种情况下,coolwulf还专门将NeuralRad项目放入云端,进一步降低了使用门槛。


从这个角度来看,无论是阿里达摩院的PANDA,还是coolwulf最近建立了一个NeuralRad,它不仅可以帮助患者尽快筛查癌症,摆脱死亡的魔爪,还可以让更多医疗资源稀缺的区域在空间维度上填补资源差距,让更多原本绝望、注定要逝去的人生迎来转机。



当前关于AI产业的讨论,大家都在质疑,当前的AI浪潮,到底是不是泡沫,是不是炒作。


但是,AI在医学影像方面的应用,却确实得到了证实,AI毕竟不是花哨的玩具,而是拯救生命的关键力量。仅仅因为这一点,这场AI革命,就不可能成为泡沫。


而且通过技术手段,可以清除大多数人无法解决或难以解决的痛苦,这就是科技带来的善意。


本文来自微信公众号“酷玩实验室”(ID:coollabs),作者:酷玩实验室,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com