摘要
背景
临床试验 (CT) 仍然是安全有效的药物开发的基础。鉴于医疗保健领域不断发展的数据驱动和个性化医疗方法,公司和监管机构必须利用定制的人工智能 (AI) 解决方案来实现快速、简化的临床研究。在本文中,我们确定了人工智能在 CT 中的机遇、挑战和潜在影响。
方法
在对相关数据库和网站进行广泛搜索后,我们收集了过去 5 年美国和欧洲关于在 CT 中使用人工智能和机器学习 (ML) 的出版物,包括监管机构的文件。
结果
人工智能的记录应用通常涉及肿瘤学领域,并且主要应用于招募领域。讨论的主要机会旨在提高临床试验 (CT) 活动的效率,包括减少样本量、提高入组率以及进行更快、更优化的自适应 临床试验的能力。虽然人工智能是一个蓬勃发展的领域,但所发现的挑战本质上是道德问题,与数据可用性、标准有关,最重要的是,缺乏监管指导阻碍了人工智能工具在药物开发中的接受度。然而,未来的影响是重大的,预计将提高临床试验的成功率,减轻试验负担,并加快研究和监管审批的速度。
结论
人工智能在 CT 中的应用还处于相对初级阶段;然而,这是一个快速发展的领域。随着监管机构对人工智能在特定领域的可接受性提供更多指导,我们预计使用范围将扩大,实施量将迅速增加。
关键词:人工智能 (AI)、机器学习 (ML)、临床试验 (CT)、机遇、挑战、影响
尽管长期以来人们都承认制药公司投资巨大且风险较高,但临床试验生成的证据已被广泛接受,并且可能仍然是开发安全有效药物的黄金标准 [ 1 , 2 ]。
随着人工智能被认为是实现可持续和优化药物开发的途径,CT 中的多种应用正在被讨论并开始在实践中探索。随机试验的增长和扩大推动了这一趋势,这些试验为医学研究提供了大量复杂的分类和未分类的临床、分子和影像数据。虽然数据可用性对于数据驱动和个性化医疗趋势至关重要,但从可用信息中生成可行的见解需要使用综合人工智能模型,并使用适当的数据集进行开发和训练,以有效加快和简化药物研究中的各种活动 [ 2 , 3 ]。
文献中已经发现了一系列机会,首先是人工智能对投资回报可能无法支持盈利的领域(罕见疾病、靶向治疗)的发现做出的贡献。此外,预计患者招募和方案设计效率的提高可以提高试验成功的机会,而使用人工智能监测患者和进行分析可能会对结果的测量和解释产生积极影响[ 2-5 ]。
这项研究的目的是从文献中识别和综合人工智能在 CT 中的机遇、可能阻碍其发展的挑战,并确定人工智能实施成为“常态”时的未来影响。当世界各地的公司都在考虑哪些人工智能应用程序可以提供最大收益并开始试点的早期阶段时,监管机构试图跟上步伐并检查哪些地方需要监管。因此,这次审查可能会指导公司决定投资将人工智能纳入其开发计划。此外,由于应用范围如此广泛,而且行业整体发展方向尚不明确,这可能有助于确定监管在哪些方面影响最大。
在本文中,使用了更广泛的术语人工智能(AI)和通用技术机器学习(ML),而不是文献中描述的具体方法,因为目的是识别机会、挑战和影响,而不是技术上描述如何实现解决方案。
方法
为了确定相关的纯英文出版物,我们使用广义术语“人工智能”或“机器学习”以及术语“临床试验”在PubMed、SCOPUS、国际药物文摘和谷歌学术数据库中进行了搜索。涉及 CT 之外的 AI/ML 应用的排除术语用于减少大量不相关结果(例如“临床实践”、“手术”、“诊断”、“治疗”)。
为了识别相关监管文件,使用相同的关键词搜索了欧洲药品管理局 (EMA)、欧盟委员会 (EC) 和食品药品管理局 (FDA) 的网站。
搜索于2021年10月7日至2021年10月14日期间进行,结果从源数据库和网站下载并合并到单个 Excel 文件中。为了确保研究是针对最先进的人工智能进行的,2017 年之前的所有出版物以及与欧盟或美国无关的出版物以及任何重复的出版物都被删除。这确保了最新的、范围内的出版物得以保留。最后,结果首先根据标题进行手动压缩,然后是摘要内容,未提及人工智能或机器学习在 CT 背景下的应用的出版物和/或文档被认为超出范围并排除在本次审查之外。
根据人工智能应用的研究活动对 48 篇出版物进行了审查和分类:临床前研究、设计、招募、实施和分析。表格 1提供这些类别标签的定义[ 6 ]。此外,还考虑了出版物中提到的治疗领域(TA)(如果有)。从监管机构网站提取的九份文件被归类为监管文件。
表格 1 根据人工智能的使用对论文进行分类时考虑的研究活动的定义
图示1,提供了上述过程的进一步总结。
论文研究流程图
结果
我们的研究表明,人工智能在 CT 中的潜在应用非常广泛,但招募显然是一个关键领域。超过 50% 的论文审查了SITE招募(30 篇),是试验设计(14 篇)的两倍多,也是讨论分析的论文数量(10 篇)的近 3 倍(这也是常见的)。图 2显示每个 CT 活动涉及人工智能应用的出版物数量。
图2 按分类 CT 活动涉及人工智能应用的论文数量
该图代表了人工智能在定义的 CT 活动类别中的应用,正如所审查的出版物中所讨论的那样。在范围内的总共 48 篇论文中,38 篇论文描述了人工智能在临床试验的单个活动中的应用,五篇论文描述了两项活动,三篇论文描述了三项活动,其余两篇论文描述了四项活动
此外,肿瘤学是最受关注的治疗领域 (TA)。在描述 AI 在特定 TA 中应用的 22 篇论文中,50% 讨论肿瘤学 (11)。这再次是第二个最受审查的神经病学 TA (5) 的两倍多,其次是心血管病学 (3)。图 3显示每个领域引用人工智能应用的出版物数量。
图3 每个治疗领域涉及人工智能应用的论文数量 [ 6 ]
该图代表了人工智能在治疗领域(TA)的应用,正如所评论的出版物中所讨论的那样。在范围内的总共 48 篇论文中,有 26 篇论文没有描述特定的 TA。此图显示了其余 22 篇论文中 TA 的分布,其中三篇论文在同一篇论文中描述了两个 TA
对文献的进一步分析可以识别人工智能的广泛机会,但明确强调能够提高效率的工具,无论其应用于何处的 CT 活动。例如,用于告知 CT 设计的人工智能工具可以减少试验参与者的数量和试验长度。正如所强调的那样,招募是一个令人非常感兴趣的领域,人工智能工具可以执行自动资格分析,将潜在参与者与试验相匹配,并简化试验搜索功能。在试验过程中,基于人工智能的传感器和其他可穿戴设备改善了患者监测。最后,人工智能工具可以促进更全面的统计分析,并解决数据丢失和访问缺失的挑战性问题,这在 Covid-19 公共卫生紧急情况期间尤其重要。
从文献综述中可以看出,与机遇相比,强调的挑战较少。这可能表明研究人员认为人工智能提供了值得追求的巨大潜力,尽管仍需要进行大量工作来克服常见的重大挑战。即,缺乏稳健、标准化和完整的数据集,以及构建这些数据存储库所需的协作努力。值得注意的是,CT 活动中也强调了验证和模型解释方面的挑战。
人工智能对 CT 的影响被认为非常积极。人工智能工具的实施将通过提高试验成功和监管批准的可能性来加速临床开发,使用自适应协议将增加数据的多样性,同时减轻患者和试验中心的试验负担。
数字 4,根据 CT 的每项活动,总结了人工智能的主要机遇、挑战和影响。
图4 临床试验的每项研究活动中人工智能的主要机遇、挑战和影响的总结
最后,对相关监管文件的审查表明,人工智能作为一门具有广泛应用和颠覆性潜力但需要战略规划实施的创新学科受到监管机构的欢迎。尽管有通过涵盖人工智能的地平线扫描计划进行国际合作的记录,但值得注意的是,EMA 和 FDA 在医疗保健领域的人工智能整合方面采取了不同的方式。欧盟正在努力制定广泛的人工智能监管框架。虽然 EMA 针对制药行业和 CT 中人工智能使用的统一指南尚未出台,但我们的研究发现,国家举措可能正在填补这一空白。在美国,FDA 似乎重点关注基于软件即医疗设备 (SaMD) 分类的人工智能工具的资格认证,但没有具体承认其在 CT 中的潜在用途。因此,大多数 FDA 文件被发现超出了本次审查的范围,因此不予讨论。
讨论
下面讨论了已确定的机遇和挑战,以及人工智能集成的未来后果,并通过关键 CT 活动或监管相关文件进行了总结。
1、临床前研究
新靶点发现及毒性预测
人工智能可以通过增强和加速新分子目标(基因或蛋白质)的识别来帮助解决未满足的医疗需求。需要访问来自先前临床前和临床研究(包括失败的试验)的大型药代动力学 (PK) 和药效学 (PD) 数据集,以开发和训练有效且可靠的算法,以生成具有真正治疗潜力的新稳定分子。由于竞争或专有原因,缺乏已发表的 PK/PD 数据是充分发挥人工智能在新药发现方面的潜力的重大障碍 [ 4 , 7 ]。
描述了几种用于安全预测的人工智能方法。事实上,软件可以根据目标信息预测药物毒性。有效的毒性预测有可能取代体外和动物模型作为传统的临床前方法[ 8 ]。此外,这些模型可以通过提供带有重大安全问题标记的高风险化合物的早期提示,用作开发管道中的风险管理和优先级排序工具[ 4 ]。
与其他人工智能领域一样,模型解释可能具有挑战性,特别是考虑到研究早期阶段的高度不确定性。了解模型特征和潜在的生物机制是预测的可解释性和可信度的关键[ 4 ]。
设计
1、通过 CT 预测患者结果
临床结果的预测对于精准医学的出现至关重要,并通过消除一般人群的统计变异性来为试验设计提供信息。事实上,人工智能可以用来模拟数据来检测更有效的统计结果指标[ 9 ]。一份报告表明,使用人工智能算法来预测参与者的结果,并确定那些最有可能快速进展并更快达到终点的参与者,可能会缩短试验持续时间 [ 10 ]。此外,通过分析电子病历,人工智能还提供了预测 CT 退出可能性的机会[ 1 ]。心血管技术援助并没有排除潜在的退出者,而是努力针对这些特定的参与者,并为他们提供额外的教育,以鼓励更长时间的参与[ 1 ]。这些工具可以减少总体样本量,因此试验需要更少的参与者[ 1 ]。
另一份报告表明,ML 预测模型可以将多个 CT 中的癌症死亡率降低 15-25% [ 11 ]。这种机器学习算法能够根据环境和遗传属性进行分层的临床结果预测,可以从大型生物数据库中创建,该数据库将介入试验中的药物相关预测生物标志物与无进展生存数据和总体生存数据相关联,并按肿瘤的分子概况排列[ 11 ] 。另一项分析非小细胞肺癌试验数据的研究测试了生物标志物状态(以及其他更复杂的驱动因素)在使用 ML 肿瘤生长模型预测肿瘤反应和生存率方面的有效性 [ 12 ]。
这些人工智能工具可以用来增强药物选择并使研究药物适应特定癌症的组织学,从而提高生存率。仍有望取得进展,但随着机器学习模型包含来自多组学特征的综合数据,有可能改变治疗范式并重新定义精密试验的设计和招募方式。
2、预测试验成功的概率
有证据表明 ML 算法支持疾病的早期检测和预后,从而提高 CT 的整体成功率 [ 9 ]。超出临床预期,人工智能可以在临床研究的早期阶段运用来预测分子特征、靶标敏感性、生物利用度和毒性[ 7 , 13 ],并减少后期试验失败,从而帮助设计PhII/PhIII试验更有可能获得监管部门的批准。对人力和财力资源的影响,以及对参与者安全和公众对 CT 认知的保护,是无可辩驳的 [ 3 , 7 ]。
结合 CT 设计和患者特征数据集的 ML 模型不仅可以用来预测监管部门的批准,还可以用来估计阶段转换成功的概率 [ 14 ]。了解影响每个阶段成功和失败的因素(主要是方案的复杂性、临床终点的选择、介入组和资格标准)会影响当前和后续阶段的试验设计[ 3 , 12 ]。根据文献中可用的副作用或缺乏疗效的风险评分开发类似的模型也可能有助于设计更好地保障参与者的福祉和安全的试验。
最后,在肿瘤学领域,人工智能被应用于构建In-Silico试验,该试验使用临床数据来构建模拟治疗效果的模拟队列 [ 15 ]。这些还提供了通过识别更好的响应者来减少后期开发失败的潜力[ 15 ]。尽管如此,挑战仍然是缺乏高质量、精心策划和完整的可用数据集,这往往限制了人工智能应用的潜力[ 15 ]。
3、重塑临床试验设计
AI 解决方案可以实现更快、更准确的假设生成和分析,以增强我们对疾病演变的理解,并改善药物发现、队列组成、监测、依从性和终点选择 [ 2 , 3 ]。简而言之,在设计中实施人工智能方法后,观察到结果有所改善。例如,通过方案丰富和生物标志物验证来提高队列组成的适用性。然而,需要协作努力构建用于收集、存档和组织大型数据集的通用协议,从而减少人工智能输出中的错误[ 2 ]。
此外,精心设计的人工智能工具可以获取足够的优质数据,可用于在虚拟控制臂内预测疾病进展[ 10 ]。这可以允许安慰剂臂被仅由合成数据组成的完全虚拟臂取代[ 10 ]。预计会带来一些好处,包括减少预算、减少现场和患者负担以及可能加快 CT 速度。然而,基于与现有 CT 一起构建的训练数据集验证虚拟控制臂需要投入大量时间和资源。合成对照组还有可能消除有关安慰剂对照组的伦理问题,并鼓励参与者不愿意冒随机化安慰剂的风险[ 2 ]。
建立基础设施和多学科专业知识来支持此类新技术是一个漫长的过程。道德考虑也仍然是一个障碍,特别是考虑到防止健康信息被滥用仍然是一个挑战[ 3 ]。
4、招募
在 CT 的设立和实施过程中存在的一般障碍中,招募参与者仍然是一个严峻的挑战。众所周知,招募不当对试验的时间和相关财务成本的影响是巨大的[ 16 , 17 ]。这种招募挑战是由于复杂的方案、缺乏对试验的认识、对参与的情感恐惧以及往往只是缺乏参与的兴趣造成的[ 16 , 17 ]。
纳入和排除标准也变得更加复杂,使得招募合适的患者变得困难,他们必须满足所需的选择标准,以避免潜在的混杂因素或错误分类[ 18 , 19 ]。
在整个治疗领域,人们强调人工智能工具可以结合人口统计、实验室、成像和其他组学数据等数据,将患者与这些复杂的纳入标准相匹配,确保适合招募[ 10、16、17、20 ]。
自动试验推荐还有进一步的机会,这意味着人工智能可以通过公共 CT 平台向更广泛的潜在试验参与者提供信息,从而增强患者选择 [ 17 ]。通过使用代谢领域的大规模数据集,事实证明人工智能工具也支持更公平的试验访问,这可以被认为是一个重要的含义[ 21 ]。正如艾滋病毒研究所证明的那样,此类方法可用于提高临床试验搜索的意识并有助于匹配引擎[ 22 ]。
表 2进一步描述了应用于各种协助招募的人工智能工具的示例。
表2 招募中的人工智能应用示例
这些人工智能工具在招募中有效发挥作用的根本基础是实施资格标准的标准化语言,以实现系统的互操作性。该工具必须能够读取和理解输入,以便实现其预期用途 [ 23 , 24 ]。因此,建议将结构化数据与从患者报告的自然语言处理中获得的见解相结合,以补充资格筛选的信息可能是有益的[ 25 ]。最近的一些工具已经在系统提取方面显示出有希望的结果,例如,clinicaltrials.gov 数据库总结了超过 350,000 项试验的资格标准 [ 26 , 27 ]。
另一个机会与关键 CT 的高运营负担有关,导致申办者根据他们在之前 CT 的专业知识和表现来保留首选研究者的简短名单。人工智能可以为内部研究者排名提供一种快速且便利的方法,这将加快网站启动速度,从而对招聘产生积极影响[ 28 ]。
执行
1、在试验中使用数字健康技术 (DHT)
通过纳入自动化数据收集工具,并开发依赖人工智能算法解释数据并将其转化为可用见解的新型数字生物标记,可以向研究站点提供使用可穿戴设备和传感器的近实时访问,以获得数据的可视化参与者的状况[ 29 ]。改善试验参与者的安全监督,特别是那些患有危及生命或身体衰弱的参与者,是一个明显的优势,可以通过更快地获得可行的见解来促进。
据报道,其他机会已应用于精神科和神经科疾病,包括研究药物 (IMP) 的依从性,这是 CT 的主要挑战。虽然其他技术可用于跟踪参与者何时打开 IMP(可能是为了服用剂量),但有证据表明这些技术可能无法提供准确的数据 [ 30 ]。这就是人工智能可以提供改进的方法来监控和确认 IMP 摄入量的地方。内置人工智能算法的视频捕捉设备可用于更可靠地确认参与者何时服药。这种工具被认为是在现场工作人员亲自观察参与者给药之外确认研究药物依从性的唯一方法,这通常不是可行的替代方案 [ 30 , 31 ]。
2、医学图像的分析和工作流程管理
使用人工智能来简化审查并补充医学图像的分析是进行试验活动的一个公认的机会。人工智能算法可以支持重要标记的自动注释,这些标记通常由专家手动导出 [ 10 , 32 ]。人工智能还可以通过使用自动图像分类工具并加快专家的阅读时间来改进成像审查的工作流程[ 29 ]。
该领域的一个重大挑战是建立训练算法所需的良好标准化图像存储库非常耗时且费力[ 32 ]。
分析
1、确定效应异质性
虽然研究表明很少有完美的同质治疗效果,但识别效果异质性对于 CT 统计学家来说是一个众所周知的问题 [ 33 ]。使用心血管数据集对人工智能应用程序进行训练,以询问 CT 数据并识别显示不同治疗效果的亚组,以及识别亚组中的关键风险因素和快速反应者 [ 16 , 33 ]。这些工具为药物开发商提供了更全面的分析和更好的见解的机会。然而,监管接受的挑战要求研究人员找到方法来充分验证这些新模型提供的结果[ 33 ]。
2、估算缺失数据并处理缺失的研究访视
在 COVID-19 大流行期间,由于临床研究中心资源的重新分配、前往临床研究中心的困难以及参与者感染病毒或因此而不得不隔离,许多 CT 受到了影响。这些问题可能导致数据缺失和研究访问延迟,从而影响统计分析[ 34 ]。机器学习可用于估算丢失的数据,还可以在访问延迟超出协议定义的窗口时推断参与者的状况 [ 34 , 35 ]。
3、支持分析的自动化
我们的研究还强调,人工智能工具可以支持将数据提取自动化到统计分析工具中,以减少手动工作和相关人为错误[ 5 ]。正如在其他人工智能应用中看到的那样,该领域的挑战涉及开发和验证此类算法所需的工作[ 5 ]。
4、规范性文件
在欧盟,有关人工智能的举措正在不同层面上进行。EC 正在开发一个以卓越和信任为基础的人工智能总体框架和治理模型。关键优先事项是基础设施、专业知识和尊重原则(例如,准确性和监督、安全和隐私、透明度、多样性和非歧视),以维护道德方面和欧盟基本权利[ 36 ]。
欧盟监管提案(称为《人工智能法案》)建立了高风险人工智能(包括 SaMD)的合格评定,涵盖风险管理、数据治理、自动记录保存、人机界面和网络安全要求[37 ]。该法规的实施需要创建欧盟共享数据库并在上市前和上市后阶段完全访问数据集,这两者都特别具有挑战性[ 37 ]。
在开发和审批中使用人工智能已纳入 EMA 到 2025 年的监管科学战略。制药行业利益相关者优先考虑与学术界和专家中心合作,建立人工智能验证和评估的监管框架和指南 [38 ]。虽然 EMA 的统一指南尚未出台,但成员国正在采取国家举措。例如,意大利监管机构 (AIFA) 提交 CT 的指南将 AI/ML 纳入的主要风险确定为 CT 参与者的安全性以及为支持批准而收集的临床数据的有效性。为了解决这些问题,AIFA 要求提交利益-风险评估,表明人工智能集成是有用和有价值的,没有安全影响,并且算法对证据生成的贡献是可靠的[ 39 ]。
在美国,FDA 数字健康卓越中心 (DHCoE) 发布了 SaMD 开发和认证指南,并启动了软件预认证试点计划,如果归类为 SaMD,则两者都适用于 CT 环境中使用的 AI/ML 解决方案 [ 40 ]。此外,最近发布的 MD 良好机器学习实践解决了所审查的几篇出版物所强调的挑战(例如,数据集的代表性以减少偏差;在模型的实际训练过程中通过模型监视和风险管理进行持续评估)[ 41 ]。
从全球合作的角度来看,值得注意的是,国际药品监管机构联盟(ICMRA)将人工智能列为挑战当前监管的三大创新主题之一。存在问题的领域是接受人工智能生成的数据和算法进化,需要事先提供科学建议。计划在 CT 中使用人工智能工具的申办者应充分披露评估算法,并证明其在招募、诊断、疾病进展监测或终点测量方面优于传统方法的优势[ 42 ]。这种对早期建议的鼓励为赞助商提供了增加批准机会、分享专业知识并影响未来数字健康解决方案监管指导的机会。
ICMRA 预见的其他挑战涉及试验实施(例如,更复杂的知情同意;参与者/研究人员对人工智能工具的可用性)以及在监管机构、伦理委员会以及数据和安全监测委员会中建立足以支持评估的人工智能专业知识[ 42 ]。
最后,世界卫生组织(WHO)强调道德使用和治理是人工智能在医疗保健领域使用的主要关注点。CT 背景下的道德挑战包括使用和管理经同意收集的机密数据;确保数据包容性,以避免产出出现偏差和不平等;对受私人商业所有权和相关法律框架限制的算法的访问和控制。世卫组织建议的原则应指导整合人工智能的监管框架和医疗保健实践的构建[ 43 ]。
优点和局限性
我们的评论提供了有关按 CT 活动和相关治疗领域专门分类的人工智能应用的信息,这些信息揭示了超出现有文献评论的见解。它重点关注 2017 年至 2021 年 10 月期间出版的出版物,仅与美国和欧盟相关,这可能排除了最近在全球相关市场中使用人工智能的出版物。讨论分类为 SaMD 的人工智能干预认证的研究被认为超出了范围,尽管这些研究可能提供了有关 CT 中接受人工智能工具的要求的更多信息。最后,我们的研究没有从比较的角度提供有关 CT 中人工智能结果的信息,这是一个有待进一步研究的领域。
结论
将人工智能集成到 CT 中是一个充满前景且不断扩展的领域,许多文章认为人工智能可能是克服当前药物开发现状的关键,并为可持续医学研究的新范式铺平道路。致力于评估人工智能的预期用途的努力证明,业界期待释放人工智能的全部潜力,进行更成功、更具成本效益的试验。
将人工智能整合到药物开发和审批中的方法很广泛,涵盖药物生命周期的所有阶段。然而,尽管监管机构已经发布了与人工智能相关的反思文件和战略行动计划,但仍然缺乏针对 CT 内人工智能使用的具体和详细的监管指南。
医疗保健作为监管最严格、规避风险的行业之一,预计将在全球范围内缓慢但安全地适应数字化转型。因此,尽管报告热情高涨,但仍然需要开展大量工作,包括定义适当的道德和监管框架。
在不久的将来,我们鼓励所有利益相关者分享经验教训,并共同努力建立一种稳健、合乎道德且以患者为中心的方法,以实现人工智能在研究中的标准化整合。因此,考虑在 CT 中使用人工智能正常化的申办者、研究人员和监管机构需要共同构建缺失的基础设施和专业知识,以确保患者最终保持安全和受到保护。