為規范人工智能醫療器械相關產品的管理,2023年9月15日,國家藥監局器審中心組織制定并發布了《磁共振成像系統人工智能軟件功能審評要點》,本審評要點是對磁共振成像系統人工智能軟件功能的一般要求,醫療器械注冊申請人應依據產品的具體特性確定其中的內容是否適用。若不適用,需具體闡述其理由及相應的科學依據,并依據具體的產品特性對注冊申報資料的內容進行充實和細化。
為規范人工智能醫療器械相關產品的管理,2023年9月15日,國家藥監局器審中心組織制定并發布了《磁共振成像系統人工智能軟件功能審評要點》,本審評要點是對磁共振成像系統人工智能軟件功能的一般要求,醫療器械注冊申請人應依據產品的具體特性確定其中的內容是否適用。若不適用,需具體闡述其理由及相應的科學依據,并依據具體的產品特性對注冊申報資料的內容進行充實和細化。
磁共振成像系統人工智能軟件功能審評要點
本審評要點是對磁共振成像系統人工智能軟件功能的一般要求,申請人應依據產品的具體特性確定其中的內容是否適用。若不適用,需具體闡述其理由及相應的科學依據,并依據具體的產品特性對注冊申報資料的內容進行充實和細化。
本審評要點是供注冊申請人和技術審評人員使用的指導性文件,但不包括注冊審批所涉及的行政事項,亦不作為法規強制執行,應在遵循相關法規的前提下使用本審評要點。如果有能夠滿足相關法規要求的其他方法,也可以采用,但是需要提供詳細的研究資料和驗證資料。
本審評要點是在現行法規和標準體系以及當前認知水平下制定的,隨著法規和標準的不斷完善,以及科學技術的不斷發展,相關內容也將適時進行調整。
本審評要點不包含臨床評價的要求,也不包含人工智能倫理、數據產權等法律法規層面要求。
一、適用范圍
本審評要點適用于采用人工智能技術(artificial intelligence, AI)的磁共振(magnetic resonance, MR)成像系統。按照現行有效的《醫療器械分類目錄》,該類產品分類編碼為06-09,管理類別為III類。
本審評要點所指的AI軟件功能,必須運行于MR系統,且作為軟件組件隨MR系統進行注冊。某些AI軟件功能以專用型獨立軟件形式呈現,運行于MR系統的通用計算平臺(工作站等),如其作為附件隨MR系統進行注冊,可以視為MR系統的軟件組件。
二、產品簡介
MR成像無電離輻射危害,具有良好的圖像對比度,是臨床常見的影像學檢查方法。近年來,MR系統的磁場強度和成像分辨率不斷提升,多參數和定量化的成像序列不斷涌現,移動式、超低場的產品也逐漸用于臨床。基于大數據的AI技術進一步推動了相關行業發展,除了利用AI技術進行MR圖像處理的獨立軟件產品,MR系統本身也開始通過AI技術實現產品賦能。
(一)成像優化
利用AI技術對MR成像進行功能完善和性能提升,常見應用場景包括:① 改善圖像質量(例如:圖像降噪、運動偽影去除等);② 優化圖像重建(例如:欠采樣重建、超分辨率重建、多參數定量圖像重建等);③ 提升成像速度(例如:減少掃描時間,優化動態成像、實時成像的性能等)。
(二)工作流程優化
利用AI技術提升MR系統的工作流程的質量和效率,例如:在磁共振定位像中智能規劃掃描區域和層面,減少人工操作時間,提高掃描定位的準確性和可重復性。
(三)定量計算
利用AI技術在MR圖像中對器官、組織、病灶等進行定量分析(例如:體積、圖像紋理、生理參數等),輸出結果用于診斷、治療及療效評估。定量計算軟件功能一般用于處理圖像或其他類型數據,其臨床應用場景可能涉及輔助分診、輔助檢測、輔助評估、輔助診斷、輔助治療等,通常不控制成像硬件、不干預掃描操作。
從MR系統掃描和輸出圖像的角度,AI軟件功能也可以按照涉及的產品模塊或成像過程進行劃分,例如:準備、掃描、前處理[1]、后處理等。由于MR系統復雜度較高,各種劃分方法在一定程度上存在交叉和重疊,某個軟件功能可能同時對前處理、后處理等多個環節產生較大影響,需要依據工作原理、預期用途、產品功能、臨床使用場景等進行綜合評價。
四、審評主要關注點
在參照適用的法規、規章、指導原則和標準的前提下,請結合下列關注點開展技術審評。
(一)綜述資料
參考《醫療器械通用名稱命名規則》的要求,具有AI軟件功能的MR系統宜采用通用名稱,即“磁共振成像系統”或“磁共振成像設備”,醫療器械注冊證載明的產品名稱中不宜增加“智能”等修飾詞。此外,產品結構組成和適用范圍一般與常規MR系統的注冊證載明信息保持一致,例如:“該產品由3.0T超導磁體、射頻線圈、......組成”、“該產品適用于臨床磁共振成像診斷或檢查”。
申請人可以在產品技術要求或產品說明書中體現AI軟件功能。
由于MR系統已經按照第三類醫療器械進行管理,即風險最高的管理類別,所以是否采用AI技術不會導致其調增產品管理類別。
采用AI技術的MR系統在注冊申報時,需要針對具體的AI軟件功能,逐項描述工作原理、處理對象、適用疾病(若適用)、適用人群、適用人體部位、臨床用途、使用限制、禁忌證等內容。若適用,請提供AI軟件功能關于兒童應用的必要說明和評價資料。對于某些僅適用于兒童或成人的軟件功能,建議在產品技術要求和說明書中進行提示和說明。
以AI降噪功能為例,需要說明兼容的成像序列(類型、2D/3D、是否加速采集等)、射頻線圈(類型、部位、發射/接收等)的要求,以及輸出圖像類型(定量或非定量等)、適用人群和人體部位、使用限制等信息。
(二)非臨床資料
1. 產品風險管理資料
目前,AI技術已融入臨床MR檢查的各個環節,需要采用基于風險的全生命周期管理方法進行科學監管,風險管理活動應依據預期用途(用途類型、目標部位和疾病、重要程度、緊急程度等)、使用場景(適用人群、疾病特征、目標用戶、使用場合、臨床流程等)、核心功能(核心算法、處理對象、數據兼容性、功能類型等)予以實施。
成像優化的主要風險是AI技術導致圖像質量下降或損失關鍵診斷信息,例如:快速成像的加速倍數過高、掃描時間過短,導致圖像質量下降的風險;圖像降噪、運動偽影去除等軟件功能導致圖像失真的風險。
工作流程優化同樣需要考慮是否引入了類似的風險。以掃描層面自動定位功能為例,如果出現定位錯誤,可能導致無法獲得預期目標圖像、成像質量下降的風險,相應的風險緩解措施包括改進層面位置和方向的顯示方式、提示操作者確認自動定位結果、允許操作者手工調整等。
涉及定量計算的軟件功能,定量結果錯誤或偏差可能對患者診療方案造成較大影響,是影響風險分析結果的關鍵因素,需要對其危害程度進行詳細分析。在輸出定量指標時,宜提供與定量指標相關的其他輔助信息,盡可能降低定量結果錯誤或偏差導致的診療決策錯誤的風險(詳見附件1)。
已上市的MR系統通過變更注冊申請新增AI軟件功能,可能會導致原有產品或功能的預設參數、掃描方式、用戶操作習慣等發生較大變化,申請人應對相關風險予以識別并采取必要措施。
2. 產品技術要求及檢驗報告
依據AI軟件功能的臨床用途,預期對產品安全有效性產生重要影響的項目,宜在產品技術要求中制定相應的、具體的性能指標條款,且條款內容需要準確、簡要、客觀的描述其所實現的產品功能。
以圖像降噪功能為例,宜按照用戶可選的圖像降噪級別,分別驗證各級輸出的圖像質量。其他宣稱具有改善圖像質量或提升成像速度等相似用途的軟件功能,均建議參考以上示例,制定適宜的性能指標條款。若軟件功能的運行時間是影響產品臨床使用的重要因素,則建議選取典型應用場景并規定相應的性能效率要求。
此外,申請人需要說明AI軟件功能的使用條件或限制條件,以及檢驗用線圈、適用部位、成像序列及掃描參數等重要內容,并提供檢驗典型性的必要說明,具體示例詳見附件2。
3. 研究資料
3.1 軟件研究
3.1.1 軟件
軟件研究報告需要列表描述采用AI技術的產品核心功能和核心算法,宜提供專題研究資料。申請人應依據AI軟件功能的技術特點、風險程度和應用場景,開展相應的軟件測試,并保證軟件驗證和確認的質量。
若AI軟件功能已在境外獲批上市,建議提供相關產品功能的境外上市批件,以及境外上市申報提交的軟件研究資料。
涉及定量計算的軟件功能,需要提供其輸出結果的準確性、一致性等方面的評價資料(詳見附件1)。
3.1.2 網絡安全
若AI軟件功能具有遠程訪問與控制接口,或采用了云計算、移動計算等《醫療器械軟件注冊審查指導原則(2022年修訂版)》第七章中提及的其他相關功能,需要結合產品預期用途、使用場景和核心功能,基于保密性、完整性、可得性等網絡安全特性,對相關風險予以重點關注。
4. 其他資料
申請人在開展MR系統AI軟件功能的評價研究時,宜參考《人工智能醫療器械注冊審查指導原則》的適用內容,重點關注訓練數據質量控制、算法泛化能力、臨床使用風險等關鍵因素,并結合《醫療器械軟件注冊審查指導原則》、《醫療器械網絡安全注冊審查指導原則》、《醫療器械生產質量管理規范獨立軟件附錄》等規范性文件的要求,提供專題研究資料。
除上述通用要求之外,基于MR成像原理及其圖像固有特征,建議申請人參考下文內容對AI軟件功能進行充分評價。
4.1 算法原理和實現過程
申請人應針對具體軟件功能描述所用AI技術和涉及的產品模塊。一般而言,僅用于前處理或后處理的AI軟件功能的算法原理和實現過程存在較大差異。
考慮到可追溯性、可解釋性等AI技術難點尚未完全解決,申請人需要重點關注算法原理,以及所用算法與MR成像物理過程的相關性(若適用),避免AI算法產生非預期的圖像失真等類型的錯誤(例如:信號丟失、圖像分辨率劣化、病灶及周圍組織形態改變等)。
4.2 訓練數據和歸一化、泛化能力
MR圖像的像素值通常反映的是人體組織間相對變化程度,并不直觀對應于某個明確的物理量(例如:CT圖像的HU值),難以直接用于定量分析。除了人群因素影響(地域、年齡、性別等),即使是對相同患者和部位進行掃描,MR設備的型號、場強、操作者等諸多因素均會導致圖像產生較大差異,不同序列采集圖像之間直接比較像素值也缺乏實際意義。上述問題源于MR成像技術本身,也源于臨床缺乏標準化掃描協議,進而影響AI軟件功能的泛化能力。
運行于MR系統計算平臺的AI軟件功能,一般與MR系統源自同一制造商,可以在多個MR系統上進行部署,同時也存在集成第三方現成軟件實現AI賦能的情況。針對復雜應用環境,AI軟件功能的訓練數據除了滿足一定的規模要求之外,還需要充分考慮數據的多樣性,包括掃描方式(2D/3D、平掃/增強、擴散加權、MRA等)、掃描參數(場強、層數、層厚、層間距、成像矩陣等)和圖像質量(偽影、噪聲等)等因素,以及不同MR系統和制造商的影響,以保證AI軟件功能面對臨床實際圖像具有良好的歸一化能力。若適用,歸一化能力可以采用定量指標進行評價,例如:選取不同來源的圖像進行歸一化處理,并對所得圖像的像素均值、方差、極值、直方圖形態等進行測試分析。
對于某些圖像處理算法,可能采用自然照片等其他模態圖像進行預訓練,通過遷移學習等方式,生成適合MR圖像的最終模型。受限于MR圖像獲取難度較大,采用類似策略可以快速擴大訓練數據集規模,提升模型性能,但是需要關注其輸出圖像是否符合預期質量要求,以及驗證方法的合理性。若適用,需要重點關注數據擴增方法的合理性,以及數據擴增對模型訓練造成的潛在不良影響,對數據偏倚等風險采取有效控制措施,具體內容詳見《人工智能醫療器械注冊審查指導原則》。
4.3 驗證與確認
4.3.1 軟件功能驗證
AI軟件功能應按照設計需求及功能定義,參考典型應用場景開展驗證工作。建議關注AI算法導致的變化(產品功能、工作流程等),結合輸入輸出特征,合理規定測試條件,完成軟件功能的整體驗證,確認相關變化符合設計需求。一般而言,與傳統方法或非AI賦能的其他方法相比,AI軟件功能的綜合評價結果應至少是非劣效的。
4.3.2 軟件功能確認
一般需要客觀證據證明AI軟件功能可以滿足用戶需求和預期目的,包括軟件確認測試、臨床使用、設計評審等系列活動。建議按照具體設計需求,在真實或模擬臨床應用場景下實施軟件功能確認。
4.4 關鍵技術特征
4.4.1 定量計算
按照難易程度,定量計算可大致分為兩類:簡單定量計算功能,常用于直接客觀測量的物理量(長度、角度、面積等),宜明確測量范圍、誤差等指標要求;復雜定量計算功能,常用于涉及間接測量的對象和場景,包括病灶分割、物質分解和量化等。具體內容詳見附件1。
以MR圖像數據的定量計算為例,輸入圖像質量及掃描參數(層厚、層間距、層內分辨率等)可能對輸出結果產生較大影響[2],需要采取相應措施(例如:增加圖像歸一化等預處理環節;對測量結果及偏差給予必要的用戶提示等)。此外,建議結合應用場景和目標用戶,合理選用計量單位,例如:相對于物理長度單位,采用像素數量作為計量單位,在某些情況下可能更易于理解和使用。
4.4.2 多參數成像
采用多參數成像序列,以及特定的圖像重建和處理方法,一次掃描可以獲得多個具有診斷意義的參數指標。AI技術結合多參數成像,除了優化掃描過程,也可以最大化利用各個參數之間的互信息,進一步提升輸出結果的準確性。
若適用,需要明確AI軟件功能兼容的多參數成像序列,詳細描述標準操作流程和具體要求,并全面評估其魯棒性。例如:圖像降噪功能是否適合多參數成像輸出的所有圖像類型;如果部分圖像或參數缺失而導致輸入數據不完整,基于多參數成像的定量分析功能是否具有防止輸出錯誤結果的相應措施。
4.4.3 擬合其他模態圖像數據
通過特殊采集和處理的MR圖像,可以用于擬合生成CT圖像(以下簡稱合成CT),類似應用還包括擬合生成DR圖像等。
MR圖像的軟組織對比度較好,適合放療靶區勾畫以及圖像引導,但是存在像素值絕對定量困難等問題。采用AI技術對MR圖像進行HU值預測,獲得的合成CT圖像保留了軟組織對比度優勢,預期可以替代真實CT圖像用于放療計劃和模擬。合成CT圖像一般需要特定的掃描序列和處理方法,例如:水脂分離成像等。
AI軟件功能用于擬合其他模態圖像時,需要詳細說明輸入數據和輸出數據的具體要求,以及輸出數據的具體臨床用途。輸入數據一般是MR圖像和必要的成像參數(掃描序列、采集方式等)。輸出數據一般是擬合生成的其他模態圖像及其輔助信息,并需要符合預期的質量要求。
(三)產品說明書和標簽樣稿
產品說明書需要詳細描述AI軟件功能,包括臨床使用的注意事項、局限性、警示或提示等重要內容,必要時可以通過專題章節進行講解,以最大程度緩解AI技術的已知風險,也可參考附件1的適用內容和要求。
(四)體系考核關注點
對采用AI技術的MR系統開展生產質量體系核查時,建議核查人員結合本審評要點第三章節內容,逐項梳理AI軟件功能的清單,并重點關注設計開發資料。
五、《醫療器械安全和性能基本原則清單》各項內容的適用性
略