您当前的位置:检测资讯 > 科研开发

人工智能医疗器械软件的验证与确认步骤

嘉峪检测网        2024-12-31 09:36

我在医疗器械行业拥有15年多的从业经验,见证了技术在医疗保健领域的变革潜力,其中包括将人工智能(AI)整合到医疗器械中。人工智能能够非常精确地分析大量数据,可以彻底改变早期诊断和治疗,最终挽救生命。然而,要充分发挥人工智能的潜力,我们必须通过严格的验证和确认流程来确保其可靠性和安全性。本指南旨在揭开这些关键步骤的神秘面纱,为开发值得信赖的癌症检测人工智能系统提供一条清晰的道路。

 

人工智能正在彻底改变癌症检测领域,提供前所未有的准确性和效率。然而,确保这些人工智能系统的可靠性和安全性至关重要。这一过程涉及两个关键步骤:验证和确认。让我们结合人工智能医疗器械标准、FDA 指南和IEC 62304 要求,以简单明了的方式分解这些步骤

 

步骤 1:验证--确保人工智能正确运行

 

验证的目的是确保人工智能软件的构建正确无误,并能按预期运行。这就好比在烤蛋糕时检查自己是否按照食谱准确操作。下面介绍如何进行验证:

 

示例:Building an AI Model to Detect Lung Cancer

 

1.定义需求(Define Requirements)

 

明确概述人工智能需要做什么。例如,“人工智能必须以95% 的准确率识别 X 光图像中的肺癌”。

 

需求文档可以说明:

 

输入:标准医疗格式(如 DICOM)的X 光图像。

 

输出:肺癌存在的概率分数(0 到1)。

 

性能:准确率至少 95%,灵敏度至少90%,特异性至少 85%。

 

所需文件:

 

软件要求说明书(Software Requirements Specification,SRS):详细描述软件的预期功能、性能标准和运行环境。

 

2.设计规格(Design Specifications)

 

规划人工智能模型的结构。你将使用什么算法?数据将如何在系统中流动?

 

设计文档可包括:

 

数据预处理模块:将医学图像转换为标准尺寸和格式。

 

特征提取模块:使用先进的图像处理技术识别相关特征。

 

分类模块:应用机器学习模型,根据提取的特征对图像进行分类。

 

后处理模块:将模型输出转换为可读格式,以便诊断。

 

所需文件:

 

软件设计说明(Software Design Description,SDD):一份详细的设计文件,概述系统内的架构、模块、数据流和交互。

 

3.实施

 

根据设计开发人工智能模型。这包括选择适当的机器学习技术并对其进行编程。

 

实施可能包括:

 

使用卷积神经网络(CNN)进行特征提取。

 

使用标有 X 光图像的大型数据集训练模型。

 

优化模型参数以提高准确性。

 

所需文件:

 

源代码:人工智能模型的实际代码库。

 

版本控制记录:代码版本、更改和更新的文档。

 

4.单元测试(Unit Testing)

 

测试人工智能模型的各个部分(或单元),确保每个部分都能正确运行。例如,测试图像预处理步骤是否能正确准备 X 光图像以供分析。

 

单元测试可包括:

 

检查预处理步骤是否正确调整了图像大小。

 

验证特征提取是否能正确识别 X 光图像中的肺部结构。

 

所需文件:

 

- 单元测试计划(Unit Test Plan,UTP):详细说明各组件测试的计划。

 

- 单元测试报告(Unit Test Report,UTR):对单个组件进行测试的结果和文件。

 

5.集成测试(Integration Testing)

 

检查人工智能系统的不同部分是否能很好地协同工作。预处理步骤是否能正确输入癌症检测算法?

 

集成测试可包括:

 

运行从图像预处理到癌症检测的完整工作流程,确保所有组件无缝协作。

 

确保模块之间的数据流正确无误。

 

所需文件:

 

- 集成测试计划(Integration Test Plan,ITP):测试集成单元之间交互的计划。

 

- 集成测试报告(Integration Test Report,ITR):集成测试结果的文档。

 

6.系统测试(System Testing)

 

测试整个人工智能系统是否满足规定的要求。人工智能是否能准确识别各种 X 光图像中的肺癌?

 

系统测试可包括:

 

在综合测试数据集上评估人工智能。

 

测量准确性、灵敏度和特异性,确保它们达到要求的阈值。

 

所需文件:

 

- 系统测试计划(System Test Plan,STP):根据要求测试整个系统的综合计划。

 

- 系统测试报告(System Test Report,STR):全系统测试的结果和文档。

 

步骤 2:确认--确保人工智能解决正确的问题

 

确认是为了确保人工智能软件满足用户的需求和要求。这就像品尝蛋糕是否美味一样。以下是确认人工智能的方法:

 

举例说明:确保人工智能模型满足临床需求

 

1.定义验证标准(Define Validation Criteria)

 

从用户的角度确定成功的标准。例如,“医生应该在95% 的时间内同意人工智能的癌症诊断”。

 

验证标准可能包括:

 

临床准确性:人工智能诊断至少 95% 的时间与放射科医生小组的共识一致。

 

可用性:放射科医生应能在最低限度的培训下使用人工智能工具,并将其整合到工作流程中。

 

所需文件:

 

验证计划:概述根据用户需求验证人工智能的标准、方法和流程的计划。

 

2.收集真实世界的数据(Collect Real-World Data)

 

从实际患者那里收集不同的 X 光图像和相应的诊断,以测试人工智能。

 

从多家医院收集数据,以确保数据集的多样性:

 

不同分辨率和质量的 X 光片。

 

不同年龄、性别和病史的患者。

 

由多名放射科医生确认的注释和诊断。

 

IEC 62304 所要求的文件:

 

- 数据收集协议(Data Collection Protocol):收集和处理真实世界数据的详细程序。

 

- 临床数据报告(Clinical Data Reports):所收集数据的文档,包括患者人口统计数据、图像质量和注释。

 

3.进行临床试验

 

在可控的临床环境中使用人工智能,了解其性能如何。将其结果与经验丰富的放射科医生的结果进行比较。

 

设立一项研究,让人工智能与放射科医生一起使用:

 

人工智能首先提供诊断结果。

 

放射科医生在不知道人工智能诊断结果的情况下查看相同的图像。

 

比较结果以衡量一致性。

 

根据IEC 62304 要求提供文件:

 

- 临床试验计划:进行临床试验的详细计划,包括研究设计、协议和评估标准。

 

- 临床试验报告:临床试验的结果和分析。

 

4.分析结果

 

根据预定义标准评估人工智能的性能。它是否达到了准确性阈值?它在不同情况下(如不同图像质量)的表现如何?

 

使用统计分析评估性能:

 

灵敏度(真阳性率):正确识别的实际阳性比例。

 

特异性(真阴率):正确识别的实际阴性比例。

 

混淆矩阵,了解错误类型(假阳性和假阴性)。

 

所需文件:

 

性能分析报告:人工智能性能指标的详细分析,包括灵敏度、特异性和准确性。

 

5.根据反馈进行迭代(Iterate Based on Feedback)

 

利用临床试验的反馈来改进人工智能。如果医生发现了某些类型的错误,应改进模型以解决这些问题。

 

如果人工智能在处理低质量图像时遇到困难,则应改进预处理或训练过程:

 

增强图像增强技术。

 

用更多低质量图像来增加训练数据。

 

重新训练模型并重新评估。

 

所需文件 :

 

反馈报告:临床用户的反馈文件。

 

改进计划:根据反馈和重新评估改进人工智能的计划。

 

例如:临床试验:

 

假设人工智能在 1,000 张X 光图像上进行了测试,医生对结果进行了审查。人工智能正确识别出 950 例肺癌。

 

计算准确率:

 

准确率=950/1000=95%。

 

如果准确率达到验证标准(95%),则人工智能通过验证。

 

结论

 

验证(正确构建):

 

需求 ➔ 设计➔实现 ➔ 单元测试➔集成测试 ➔ 系统测试

 

确认(构建正确的东西):

 

定义标准 ➔ 收集数据➔临床试验 ➔ 分析结果➔迭代

 

验证可确保人工智能的构建正确无误,而确认则可确保其满足用户需求。认真遵循这些步骤并遵守 EU MDR、US FDA和 IEC 62304 准则等法规,您就能开发出可靠有效的癌症检测人工智能软件,最终使医生和患者受益。请记住,一丝不苟的测试和不断改进是在这个高风险领域取得成功的关键。

分享到:

来源:MDR小能手