人工智能是近年科技及產業界最熱話題之一,人工智能的應用已經滲透到生活的許多方面,人工智能醫療器械注冊產品也日益增多、日益成熟??紤]到人工智能醫療器械產品的新和特點,本文以示例方式為大家介紹人工智能醫療器械注冊產品設計開發檢查要點,一起看正文。
人工智能是近年科技及產業界最熱話題之一,人工智能的應用已經滲透到生活的許多方面,人工智能醫療器械注冊產品也日益增多、日益成熟??紤]到人工智能醫療器械產品的新和特點,本文以示例方式為大家介紹人工智能醫療器械注冊產品設計開發檢查要點,一起看正文。
人工智能醫療器械注冊產品設計開發檢查要點舉例
1.算法策劃
算法開發策劃階段,應對算法需求、數據收集、算法設計、驗證與確認、算法更新、風險管理、可追溯性分析等過程進行算法生命周期策劃,輸出《算法開發計劃書》。
2.算法需求
算法需求分析以用戶需求與風險為導向,結合產品的預期用途、使用場景、核心功能,綜合分析法律、法規、規章、標準、用戶、產品、功能、性能、接口、用戶界面、網絡安全、警示提示等需求,重點考慮數據收集、算法性能、使用限制等要求。輸出《算法需求規范》。
3.數據收集
3.1 數據入選、排除標準
在《算法需求規范》中明確算法數據入選、排除標準。
3.2 數據來源及質控
數據收集應確保數據來源的合規性,數據質控的充分性、有效性、準確性。
3.3數據采集
數據采集需考慮采集設備、采集過程、數據脫敏等質控要求,并建立《數據采集操作規范》。
3.4數據整理
脫敏數據匯總形成原始數據庫,不同模態的數據在原始數據庫中需加以區分。數據整理基于原始數據庫考慮數據清洗、數據預處理的質控要求。輸出《數據整理規范》,同時《數據整理規范》中需明確樣本類型、樣本量、樣品分布等信息,數據經整理后形成基礎數據庫。
3.5 數據標注
3.5.1 數據標注前應建立《數據標注操作規范》,明確標注資源管理、標注過程質控、標注質量評估等要求。數據經標注后形成標注數據庫。
3.5.2 數據標注可使用自動標注軟件,但自動標注結果不得直接使用,應由標注人員審核后方可使用;同時,自動標注軟件亦需明確名稱、型號規格、完整版本、制造商、運行環境等信息,并進行軟件確認。
3.6 數據集構建
3.6.1 基于標注數據庫構建訓練集、調優集、測試集,明確訓練集、調優集、測試集的劃分方法、劃分依據、數據分配比例,輸出《數據集構建標準》。
3.6.2 訓練集應當保證樣本分布具有均衡性,測試集、調優集應當保證樣本分布符合臨床實際情況,訓練集、調優集、測試集的樣本應當兩兩無交集并通過查重予以驗證。
3.6.3 為解決樣本分布不滿足預期的問題,可對訓練集、調優集小樣本量數據進行擴增,原則上不得對測試集進行數據擴增,對抗測試除外。數據擴增需明確擴增的對象、方式(離線、在線)、方法(如翻轉、旋轉、鏡像、平移、縮放、濾波、生成對抗網絡等)、倍數,擴增倍數過大應考慮數據偏倚的影響及風險。若采用生成對抗網絡進行數據擴增,需明確算法基本信息以及算法選用依據。
3.6.4 數據經擴增后形成擴增數據庫,需列表對比擴增數據庫與標注數據庫在樣本量、樣本分布(注明擴增倍數)等差異,以證實擴增數據庫樣本量的充分性以及樣本分布的合理性。
3.7 數據庫管理
3.7.1數據庫管理應遵循真實性、完整性、可用性、合規性、可追溯性、臨床代表性、時效性、安全性、準確性9大原則。
3.7.2應定期對邏輯數據庫的數據以及文件數據進行備份,備份文件保存在不同機架的機器磁盤上以提高備份的安全性。
3.7.3在整個數據轉移過程中,應當明確數據轉移方法、數據防污染措施以及數據銷毀方式。
4.算法設計
人工智能算法設計主要考慮算法選擇、算法目標設定分析、算法訓練、算法性能評估等要求,形成《算法設計說明書》。對于黑盒算法,算法設計應開展算法性能影響因素分析,同時與現有醫學知識建立關聯,以提升算法可解釋性。
5.驗證與確認
算法訓練過程中,需要明確算法訓練環境,應當對算法進行性能評估,以確保選擇的算法準確、有效。算法驗證階段,明確算法性能評估環境,應完成算法性能指標評估、壓力測試、對抗測試,黑盒需要算法性能影響因素分析,輸出《算法性能評估報告》。
同時,開展算法性能比較分析,詳述各類測試場景(含臨床評價)算法性能變異度較大的原因,基于分析結果明確產品使用限制和必要警示提示信息,輸出《算法性能比較分析報告》。
最后,結合算法訓練、算法性能評估、臨床評價等結果開展算法性能綜合評價,針對訓練樣本量和測試樣本量過少、測試結果明顯低于算法設計目標、算法性能變異度過大等情況,對產品的適用范圍、使用場景、核心功能進行必要限制。輸出《算法性能綜合評價報告》。
6.算法風險管理
人工智能醫療器械的軟件安全性級別可基于產品的預期用途、使用場景、核心功能進行綜合判定,并開展風險管理活動,采取有效的風險控制措施將風險降至可接受水平,并貫穿于人工智能醫療器械全生命周期過程。
人工智能醫療器械的主要風險從算法角度包括過擬合和欠擬合。從用途角度,輔助決策主要包括假陰性和假陽性,其中假陰性即漏診,可能導致后續診療活動延誤,特別是要考慮快速進展疾病的診療活動延誤風險,而假陽性即誤診,可能導致后續不必要的診療活動;非輔助決策從算法設計目標能否得以實現角度,亦可參考輔助決策分為假陰性和假陽性。應輸出《風險管理報告》,明確過擬合與欠擬合、假陰性與假陽性、數據擴增與數據偏倚等風險的控制措施。
7.算法可追溯性分析
醫療器械全生命周期管理中,應實現算法的可追溯性,并形成算法可追溯性分析報告等相關文件及記錄,即追溯算法需求、算法設計、算法實現、算法驗證與確認、風險管理、數據集的管理。
在數據收集過程中,數據采集、數據整理、數據標注、數據集構建過程中形成《數據脫敏交接記錄》《數據清洗記錄》《數據標注記錄》《數據審核記錄》《數據仲裁記錄》《數據集構建記錄》,以上記錄均由操作人員簽字確認。
數據集管理過程中,每一例數據都可追溯到唯一識別號、脫敏人員、清洗人員、標注人員、審核人員、仲裁人員、入庫人員,保證了數據收集各環節的數據和操作人員的可追溯。
8.算法更新控制
人工智能醫療器械若發生算法更新、軟件更新,均應當按照質量管理體系的要求,開展與算法更新、軟件更新的類型、內容和程度相適宜的驗證與確認活動,將風險管理、可追溯分析貫穿于更新全程,形成記錄以供體系核查。
對于算法更新,無論算法驅動型更新還是數據驅動型更新,均應開展算法性能評估、臨床評價等驗證與確認活動,以保證算法更新的安全有效性。對于軟件更新,具體要求詳見醫療器械軟件指導原則、醫療器械獨立軟件生產質量現場檢查指導原則。
人工智能醫療器械所含的每個人工智能算法,均應獨立開展需求分析、數據收集、算法設計、驗證與確認、更新控制等活動,同時考慮人工智能算法組合的整體評價要求,以保證產品的安全有效性。
若有人工智能醫療器械注冊咨詢服務需求,歡迎您隨時方便與杭州證標客醫藥技術咨詢有限公司聯絡,聯系人:葉工,電話:18058734169,微信同。