您当前的位置:检测资讯 > 行业研究

人工智能和心血管CT的技术发展趋势

嘉峪检测网        2023-04-18 12:30

1、 人工智能的进展 
 
人工智能(AI)是使用计算算法来模仿人类的智能过程和记忆。机器学习(ML)是人工智能的一个子领域,它使这些算法能够处理越来越多的数据并完善预测,而无需明确指示寻找结果。深度学习(DL)是ML的另一个子领域,其中卷积神经网络(CNN)等程序被用来处理数据,以获得越来越精确的对象检测。在医学图像分析中,这些网络通常评估标准临床放射学数据集中的体素级数据,使临床结果与超出人类视觉能力的纹理分析相关联(图1)。这些过程可以与人工智能技术相结合,这些技术可以访问电子病人记录和来自万物互联的数据,以便从巨大的数据集中推动洞察力和临床护理,这也超出了人脑的技术计算能力。
 
图1 流程图显示了人工智能对医学数据的可能实现,并显示了放射组学、机器学习和深度学习之间的异同。
然而,人工智能和ML并不是特别新的领域,它们的发展与计算机和处理能力的发展有着相似的路径。自第一台分类程序计算机开发以来已经超过70年,自第一个人工智能程序(Logic Theorists)发明以来已经超过65年(图2)。诚然,在过去十年中,计算能力的进步出现了指数级的增长,以至于越来越多的基本人工智能可以使用CPU(而不是GPU)技术提供。这一进展使该技术进入了日常用户的领域,并为整个病人路径上的日常临床医疗服务提供了真正的潜在提升。我们承认人工智能在图像处理方面具有根本性的作用,同时也促进了临床和成像大数据的整合,以改善个性化的风险分层。具体来说,我们认为人工智能和ML还没有彻底改变临床实践,没有得到临床界足够的批评性评价,而且目前被过度炒作。在被临床医生接受之前,人工智能工具应该被证明是准确和有效的(在成本和时间方面),并清楚地了解它们是如何提高诊断准确性或结果的;目前的人工智能产品缺少大部分内容,而且商业供应商也没有公开交流过。人工智能在心血管CT中的主要挑战与CT数据(由于人为因素)或使用的算法(由于有偏见的训练数据集等)产生的错误有关。
 
 
图2 人工智能的时间线——来自Anyoha R.《人工智能的历史》。哈佛大学,《新闻中的科学》。
 
本文是2021心血管计算机断层扫描学会(SCCT)年度科学会议上AI/ML大辩论的后续文章。在辩论风格中,我们强调了对 AI/ML 的期望管理的必要性,揭穿了围绕当前 AI 技术的炒作,并反驳了当前形式的 AI/ML 是解释日常临床 CCT 实践的灵丹妙药的论点。
 
2、 过度渲染人工智能“革命”
 
人工智能被吹捧为一个颠覆性的、创新性的新生代,越来越多地渗透到心血管医学和心血管成像的各个方面。然而,巧妙的营销、高影响力的论文和成像天堂的承诺真的经得起我们评估新药或医疗设备的审查吗?
如上所述,这不是人工智能炒作第一次盛行。60年代和70年代,人们对即将到来的技术革命的预测几乎相同,这场革命将改变我们生活的方方面面。这种热情和乐观情绪渗透到了社会的方方面面,激发了儿童动画片《杰森一家》,以及从《太空漫游2020》到《终结者》的科幻电影浪潮。这种炒作,以及这项技术不可避免地未能兑现被夸大的承诺,导致了资金的崩溃和近20年的忽视。人们经常注意到,那些记不住过去的人注定要重蹈覆辙。因此,这些作者关注的是,目前该技术的拥护者,无论是疏忽还是故意,都忽视了过去。
人工智能在现实世界中的临床实施比许多人希望的要慢,但人工智能的真正障碍很少被讨论。临床犹豫的原因是多因素的;新术语、新技术和复杂的“黑匣子”算法都需要新的学习。需要对研究进行专家同行评审,深入了解技术的技术挑战和潜在偏见,并对真正的临床价值进行关键评估,然后才能进行强有力的、真实的验证和监管批准。人工智能/ML的快速商业化——以及对短期投资回报的相关预期——以及对数据所有权、道德和医疗法律风险的不明确,都加剧了这一挑战。
毫无疑问,作为决策支持工具,许多人工智能过程有潜力真正支持心血管成像设备并指导患者护理。有人可能会说,心血管成像设备一直处于数字革命的前沿,人工智能可以用来改善图像采集、重建、分割、直接图像分析和解释。
然而,我们必须批判性地评估这些算法,并质疑一直以来的说法,即这项技术提高了效率、客观性和性能,同时提高了图像质量、分割、定量测量和结果预测。在医疗保健之外,尽管人工智能算法得到了广泛的应用和普及,但包括谷歌、脸书和微软在内的领先公司的生产力近年来未能与预期相反地提高;那么,这项技术真的像宣传的那样具有颠覆性吗?
虽然人工智能确实有可能简化大部分心血管CT的临床工作流程,但我们质疑这些人工智能过程在不完美的图像采集和固有成像伪影的真实世界中到底能提供多大价值(如果我们将引用的排斥率用于商业计算流动态评估,这将影响高达30%的数据集),断开的医疗保健系统数据库,没有大规模的“供应商中立”档案。必须回答的主要问题是:人工智能对专家有帮助吗?它是否提供了改进的有效性(时间、成本或两者兼而有之),错误率(与人工解释相比)是多少?它能提供诊断益处吗?此外,人工智能会对非专家的图像解读造成多大伤害?当人工智能结果(如自动分割)可能存在问题和缺陷时,非专家会仅仅信任结果而不理解吗?
 
3、 挑战炒作:重塑和进化;非革命性
 
我们已经说过人工智能不是什么新鲜事。大部分作为新技术出售的产品要么是对旧技术的重新利用,要么是将相对现代的技术重新应用到新领域。这些技术中很少有革命性的,它们当然不值得相关的炒作或价格标签。
a.放射组学:有人可能会说,心血管成像的真正革命是将放射组学(或纹理分析)用于成像数据集。然而,虽然放射组学分析的一些结果可能是突破性的,但其他结果只是对我们已经知道的进行了三角化测量。放射组学的基础建立在20世纪40年代和50年代的军事卫星成像技术上,该技术旨在利用20世纪中期卫星图像中的粒状黑白输出来区分城市地区和林地。因此,虽然分形分析、灰度出现或长度矩阵等统计工具在医学成像中的应用对我们来说可能是新的,但它们所基于的算法已经有近80年的历史了(图3A)。我们还没有现成的数据来了解或获取图像质量和伪影对放射组学评估再现性或准确性的影响。
b.基于人工智能的工作站:在工作站上生成图像的新的基于机器学习的软件已经能够(或多或少)可靠地将中心线沿着冠状动脉走行,已经超过20年了(图3B)。这需要在数千个正常数据集上教授该算法,使其能够学习沿着增强的碘柱向下移动。同样,使我们能够分割冠状动脉树的边界工具需要一个程序来确定血管的边缘,并确定什么是冠状动脉,什么是左心耳。同样,这需要以一种始终基于机器学习算法的方式训练算法,但在2000年代初并没有被标记或炒作。这些技术正在不断完善,现在包括斑块定量和识别工具。然而,如果你知道去哪里看并打开引擎盖,这些“新”技术的构建块就一直存在。
 
 
图3 那么,什么技术是新技术呢?图A展示了20世纪50年代开发的放射组学算法,而允许多平面重组的中心线算法已经存在了几十年(图B)。
 
4、 对真实的临床影响保持客观,并管理期望
 
为了在临床上有效和有用,需要将算法分配到特定任务中,以提供临床输出。在心血管CT中,这可能是在风险分析斑块类型(分类任务)、生成自动钙评分或射血分数(节省效率)或增强迭代重建或成像技术中。存在改善图像采集、图像质量、自动分割和分析的潜力,从而改善诊断和决策支持。这些进步有望改善患者的预后和最终结果。人们怎么会不同意改善工作流程、提供更多临床见解、提高准确性和风险预测,同时节省成本的人工智能工具不是医疗保健的灵丹妙药?对心血管人工智能文献的回顾将产生如此有希望的发现,但这些几乎都是胚胎结果,数据集很小,充满潜在的偏见,在现实世界中的应用有限,缺乏突破性的优势。
 
4.1 工作流程效率
 
自动化钙评分真正节省了多少时间?我们不会争论太多,当然也比可以进行自动CCTA读取或初始TAVR分割和分析的情况要少。虽然正在积极探索这些应用程序,但它们的实施一直具有挑战性。文献中充满了开创性和复杂的验证论文,几乎没有一篇能够转化为临床实践。
 
已经存在的技术可以(重新)确定临床工作清单的优先级,将报告者引导到算法检测到病理的病例。将这项技术扩展到生成自动读取正常CCTA可能是日常实践中的一个重大进步——但同样,尽管有这项技术,我们还没有做到。存在用于分割的基线技术(图4)和自动冠状动脉读取算法,但将这些算法转化为常规临床实践仍然难以捉摸。此外,这种算法的附加值还有待证明。为了确保精确的分割和轮廓绘制,特别是在存在变异解剖结构的情况下,将继续需要人工过度阅读,从而将软件降级到第二个阅读器,并降低效率。
 
目前解决的悬而未决的问题(如CACS自动化)不太可能对CCT从业者的时间需求产生重大影响。我们所寻求的工具在使用之前需要完美吗?我们的目标是让机器衍生算法为我们做这项工作,还是处理过程中耗时的部分,如分割、中心线定义和定量测量?这些进步将使我们能够进行过度阅读、必要时进行调整并签字。大多数现代工作站显然已经具备了大部分这种能力,但这项现有技术需要在冠状动脉之外进行调整和应用。重要的例子包括左心耳、TAVR和TMVR评估、冠状动脉周围和心外膜脂肪定量。这些技术不应作为大规模的AI/ML进步出售,因为它们现在还不存在。我们认为,追求完美、具有商业吸引力的产品正在扼杀现有的有价值的产品。是看不到价值,还是商业上看不到可销售的价值,这是一个有争议的话题,但有了今天存在的AI/ML工具,我们可以极大地改进工作流程和决策支持。也许迭代步骤会比等待最终的白金工具更快地推进整个领域。还应该注意的是,通过减少图像解读时间,这最终将减少报销,至少在美国等医疗系统中是这样。而且,如果人工智能算法不完善,报销的下降也会导致准确性下降,并可能导致患者预后不佳。
 
图4 使用机器学习算法的自动分割(西门子:State-of-the-Art presentation,ASM 2019)。
 
4.2 现实世界的挑战
 
正如心血管成像历史上反复证明的那样,当将特定技术引入现实世界时,其理论价值往往相形见绌。计算机自动检测(CAD)的经验充分证明了当前AI/ML诊断助手可能产生的有限影响。CAD算法是使用人类编写的代码和数学公式而不是计算机学习开发的,设计用于辅助读取乳房X光照片。由该领域专家领导的涉及31000多名女性的前瞻性随机对照试验发现,CAD提高了乳腺病变的准确性和检测能力。然而,当在现实世界中应用时,CAD的使用显著降低了敏感性,但对特异性没有益处。这表明使用诊断助手存在强大的人类认知障碍,特别是当它们的好处是增量而非变革时。敏感性的丧失几乎可以肯定是由于CAD在过度收费时缺乏过度监管的意愿。鉴于目前的法律框架将所有责任都交给了使用该工具的临床医生,而不是算法的创建者,因此没有理由期望这些结果不会在人工智能增强的冠状动脉狭窄检测和量化的使用中复制。也许并不奇怪,最近对乳腺成像、癌症诊断和胸部X射线诊断中的人工智能算法进行的审查发现,尽管这两种模型在心血管成像方面都比我们的大多数工具先进得多,但没有一种模型对常规临床实施具有显著的鲁棒性。
 
4.3 临床见解
 
有多篇论文声称,人工智能和ML算法显著提高了对心血管疾病的临床见解。向这些令人印象深刻的论文的作者道歉,我们将质疑并非所有论文都增加了我们的临床知识。一些人可能已经对我们已经知道的内容进行了三角测量(这本身就很有价值),或者在精度上增加了一点增量。这些价值可能需要不成比例的努力、时间和成本。
 
作为验证我们已经知道的与新见解的论文的例子,我们引用了关于功能性重大冠状动脉疾病和结果的ML预测因子的令人印象深刻的论文,以及血管周围脂肪的放射转录标记在改善心脏风险预测中的应用。
 
前者确定了6个与低FFR值相关的关键参数,即平均管腔面积、斑块体积、衰减值、纤维脂肪/坏死核心体积、重构指数和左前降支近端位置;在此分析之前所有众所周知的风险因素。是的,令人印象深刻,但也许不是革命性的。相反,后一项研究在一个大型验证和训练队列中关联了放射组学技术,然后将这一新特征应用于临床队列(SCOT-HEART),以证明使用新的生物标志物增强风险预测的能力。放射组学技术在新的解剖部位(冠状动脉周围脂肪)的应用已经被其他研究人员所反映(Dey等人),这是人工智能技术的一个例子,可以带来潜在的新见解。
 
为了说明增加的临床准确性相对于标准评估的价值,另一篇使用CACS和临床数据研究10年死亡预测的优秀论文证明,ML工具随着大量CACS、CCTA和临床数据的增加而逐渐增加,AUC从单独使用CACS的0.78变为使用ML CCTA数据的0.80,进一步增加AVSCD风险为0.82,ML临床数据为0.83,所有参数增加为0.85。因此,随着所有多参数数据、强大的算法(可能在商业上很昂贵)的加入,该技术将10年预测提高了7%。也许令人印象深刻,但在临床实践中交付是否可行?这样的应用需要多个不同的数据集的链接,这些数据集理想地包括成像、临床和社会数据。此外,这项工作将需要一种战略方法来连接当前断开的系统,这将需要对大多数临床实践进行大量投资。最终,人们不得不质疑,这种回报水平的投资成本值得吗?在这一点上,可能不会。
 
使用传统的统计技术同样可以实现这些进步,这些技术提供了关于变量之间的关系及其相关的准确性提高幅度的明确结果。人工智能分析的优势在于它能够识别非线性交互,这些模式可能很有洞察力,但并不总是透明的。
 
文献中有更多的论文告诉我们已经知道的事情。我们敦促大家注意不要被AI/ML这个绰号所诱惑。重要的是要退后一步,问问这是否真的增加了我们的知识,以及这些说法是否经得起我们将应用于非AI/ML手稿的高水平的通常学术审查。目前,我们正处于知识发展的(重要)低谷,但让我们看看它的真实情况,而不是我们想要的样子。在我们开始尝试跑步之前,我们必须承认爬行阶段很重要。
 
 5、图像质量的提高
 
即使在人工智能之前,CT硬件的创新也推动了图像重建算法的并行改进,能够提高精度、减少运动伪影和优化辐射。人工智能已“成功”应用于这些问题并集成到软件中。这些进步通常使用基于DL-CNN的方法和最近的生成对抗性网络(GAN)来进一步推进这一领域。
 
然而,有几个问题需要注意。首先是用于推导这些主张的基线数据的质量(通常是最佳的且没有缺陷)。这些工具在现实世界的临床实践中的应用可能不那么直接。人类临床CT专家擅长使他们的思维过程适应次优图像质量。事实上,在很大程度上,这正是人类CCT读者成为专家的原因。即使在最有经验的中心,也有很大一部分真实世界的数据集不是最优的,而且往往是由于难以辨别的原因。据称,ML和DL算法可以克服人类的主观性,产生更具可复制性的结果。这可能是真的,但算法能产生正确的解释吗?
 
心血管CT在技术上很复杂。扫描的质量取决于适当的心率控制、kV和mA设置、正确的卷积核选择、相位选择(以及对冠状动脉运动的理解)和窗值。这是在考虑受试者的人的方面(体型、BMI、采集过程中呼吸或移动的趋势等)之前。这些因素中的许多因素共同产生了不太完美的图像质量,而“垃圾进垃圾出”这句老话绝对适用于基于计算机的处理,包括人工智能和机器学习。人类的适应性和神经元的可塑性导致了非二进制的学习,并使我们能够“可靠地”克服这些陷阱。我们人类每天都在适应这一挑战,因此人工智能还有一段路要走,尤其是当这项技术被认为可以去除病变(如非钙化斑块)以“正常化”冠状动脉边界时。这些都是人工智能需要克服的基本挑战。
 
然后我们可以增加人体解剖学变异的挑战。如前所述,CCTA的冠状动脉分割已经存在了20多年;实现管腔狭窄分级、斑块评估和(使用辅助技术)血流模拟。这对于机器所理解的正常解剖结构来说很好,但正如任何心脏成像仪所知,人体解剖结构的正常变化是多种多样的。即使是最简单的变体,如LAD和LCx动脉双重起源的LMS缺失,中心线技术也经常失败。即使是简单的先天性异常也足以使自动化系统无法进行计算。
 
6、 文化和道德挑战
 
挑战现有就业模式的技术进步并不是医疗保健独有。Price-Waterhouse-Cooper预测,人工智能/ML技术将从根本上改变或在更大程度上取代30%的工作岗位。这导致了医学领域的一些夸张和歇斯底里的爆发,尤其是在放射学领域(人工智能将取代放射科医生)。然而,正如上面的论点所概述的那样,人工智能离成为一个强大的决策辅助工具还有很长的路要走,更不用说取代专业的人类了。
 
然而,和往常一样,文化挑战和不愿接受新事物是由许多因素驱动的。临床(和成像)专家对计算机科学、大数据、高等数学和专有的“黑匣子”技术缺乏了解,这加剧了人们对人工智能和机器学习的历史、其在其他职业或整个社会中的常规使用缺乏了解。进一步的障碍包括技术的巨大支出,这导致缺乏可用性和试验技术的能力有限,以及在缺乏决策辅助工具或“基本真相”仲裁者的情况下,对工具应该或可以做什么缺乏了解。
 
所有这些因素都很重要;无论是对就业的生存威胁,对人工智能的基本原理和支撑人工智能的科学缺乏了解,无法对其进行有力和科学的批判,还是在临床实践中投入使用之前无法适应技术的优缺点。难怪更广泛的临床界正在努力接受这项“新”技术。
 
此外还有伦理方面的挑战;谁拥有临床数据(患者、获取数据的机构或分析数据的公司?),如果国家提供(通过税收)或个人支付获取数据的费用,这种情况会改变吗?如果一个人因算法支持的决定而受到伤害,那么谁承担风险——医生,还是为编写算法代码的公司?一个更紧迫的担忧是,人们意识到许多设计的人工智能算法都是种族主义的,也许不是设计出来的,而是根据人类行为数据进行训练,并由以白人男性为主的人工智能社区精心制作。这导致黑人被谷歌图像识别软件贴上大猩猩的标签,并加强了警察的歧视行为。成像数据也不能免受这种影响。研究表明,算法可以从CXR和CT数据中准确、可重复地得出性别和种族。考虑到已知的女性和有色人种的治疗和诊断策略失衡,基于这些数据训练的算法可能会导致根深蒂固的强制偏见,其中许多算法的黑匣子性质掩盖了这些偏见。
 
人工智能是一个庞大而复杂的领域,许多成像社会都在努力应对,这些伦理挑战为这个已经具有挑战性的领域增加了另一层复杂性。存在着跨越无数医疗、技术和商业利益的道德原则文化冲突的真正风险。
 
7、 人工智能的商业化和理解价值
 
医疗保健是一项有利可图的努力,人工智能流程推动令人垂涎的利润的潜力是一个积极和消极的现实。从好的方面来看,大型跨国公司正在该领域投入大量资金,推动创新并为新技术提供资金。另一方面,通常需要在中短期内获得投资回报,并创造专有知识产权。虽然这些都是确保新发展转化为社会影响的重要考虑因素,但它们可能对仍处于初级阶段的强大人工智能技术的发展有害。根据2020年人工智能状况报告——投资者Nathan Benaich和Ian Hogarth对该领域进行了仔细审查的年度分析——只有15%的人工智能研究共享他们的代码。这意味着85%的研究本质上是不可复制的。这正是科学的对立面。它不仅阻碍了发展和创新,还阻碍了对稳健性、偏见和安全性的分析。在一个数百万美元风险投资渗透的环境中,它也为欺诈创造了一个肥沃的环境,因为它知道几乎不可能证明这一点。这种糟糕的做法很普遍,涉及最高层的科学期刊。在《自然》杂志上发表的一篇论文报告了人工智能算法在乳房X光检查中的性能后,数十个中心的31位学者非常关注,以至于写了一篇论文,强调了训练和基本代码的有限报告。虽然这篇论文对谷歌健康来说是极好的公关,但它对科学和临床界的价值有限。
 
8、 结束语
 
虽然人工智能被誉为医疗保健和心血管成像的未来,但我们认为,医疗保健领域的人工智能需要成长和成熟,才能真正实现其巨大的希望。目前,它是一个声音洪亮的蹒跚学步的孩子,让人知道它的存在,但它没有大一点的孩子那么精致。当受到挑战时,它会变得暴躁,它的一些说法是异想天开和疯狂的。它需要通过发展来成熟。努力融入更广泛的环境,与同时代的人(在临床世界)交朋友,并学会在社区中分享和合作。随着人类的成长,会有成长的痛苦、高潮和低谷、成功和失败。随着时间的推移,随着技术的成熟,融入临床实践(就像在更广泛的社会中一样),并承认其优势和劣势,人们会接受这项技术。目前,人工智能被过度炒作,离兑现其承诺还有一段路要走。
 
文献原文:Nicol ED, Weir-McCall JR, Shaw LJ, Williamson E. Great debates in cardiac computed tomography: OPINION: "Artificial intelligence and the future of cardiovascular CT - Managing expectation and challenging hype". J Cardiovasc Comput Tomogr. 2023 Jan-Feb;17(1):11-17. doi: 10.1016/j.jcct.2022.07.005.
 
分享到:

来源:医工研习社