FDA による AI/ML SaMD の規制

出版社:

著者情報:

トピック:

関連サービス

ソフトウェアは医療機器の分野でますます重要な役割を果たしています。クラウドベースの分析プラットフォーム、携帯電話のデジタルヘルスアプリ、臨床医のための臨床意思決定支援アシスタントなど、医療機器としてのソフトウェア(サムド)が火災に遭いました。 どうして? 理由:

  •  ヘルスケアはますますデジタル化が進んでおり、臨床データの山は急速に増加しています。
  • ソフトウェア開発は迅速で、ほとんどの場合、従来の「ハードウェア」医療機器の開発よりもはるかに迅速です。
  • 私たちは、携帯電話やノートパソコンに、複雑なソフトウェアをリアルタイムで実行できる処理能力を内蔵しています。このソフトウェアは、専門家が患者のケアを改善するためにすぐに使用できる、有意義で実用的な出力を生成することができます。

しかし、このすばらしい新しい SaMD の世界では、行動のルールはまだ決まっていません。たとえば、ソフトウェア プログラムが「アプリ」であるのはいつで、医療機器であるのはいつでしょうか。医療機器である場合、その機器が主張する機能を果たす上で安全かつ効果的であることをどうやって確認すればよいのでしょうか。また、この急成長分野を監督し、指導し、イノベーションを阻害することなくリスクを管理するのは誰でしょうか。

米国食品医薬品局 (FDA) は、米国内で州間取引されるすべての医療機器の監督を担当しています。FDA は、1976 年に医療機器の定義を定めた連邦食品・医薬品・化粧品法 (以下「法」) という指針となる法律に定められた厳格な定義に従って業務を行っています。1

もちろん、この法律の医療機器の定義を満たすソフトウェアは、FDA の管轄下に入ります。しかし、SaMD には、医療機器規制や、安全性と有効性の合理的な保証 (FDA の機器評価のベンチマーク) に関して従来の常識を打ち破る、独自の特性があります。たとえば、SaMD は、ハードウェア医療機器の一部ではなく、単独で機能する医療機器です。2 SaMD は「ハッキング」される可能性もあります。SaMD は、理解するのが困難、あるいは不可能な新しい方法で誤作動を起こす可能性があり、使用を通じて経験を積むにつれて、その場で自らを修正することさえ可能です。これらのユニークな特性は、規制科学者にとって新しい重大な課題を生み出しており、その分野は急速に進化しています。

ますます一般的になりつつある SaMD のサブセットの 1 つに、「人工知能/機械学習 (AI/ML) 搭載 SaMD」があります。これらの医療機器は、生理学的信号、バイオマーカー、画像などの医療データを取り込んで、人間ではできない、または遅く不正確にしかできない出力と洞察を生成する複雑なアルゴリズムを搭載しています。AI/ML SaMD は、非常に大量のデータ (時には数百万または数十億のレコード) を使用して開発 (つまり、「トレーニング」、「調整」、「検証」) されます。これらはパターン認識などのタスクに優れており、患者の治療中に臨床医にリアルタイムで強力な意思決定サポートを提供します。たとえば、現在、超音波画像または X 線画像で乳がん、甲状腺がん、または肺がんの疑いのある領域を識別できる AI/ML SaMD がいくつかあります。また、心電図から患者の心臓が正常に拍動していないことを判断できるものもあります。患者の電子カルテを見て、特定の患者に合わせた診断や検査を提案できる医師もいます。

 

規制上の課題

FDA と国際医療機器規制フォーラムは、過去 5 年間にわたり AI/ML SaMD について検討を重ねてきました。彼らは、AI/ML SaMD のリスクと利点を理解して管理し、それらを規制するための規制科学を開発するためのフレームワークを開発してきました。3 SaMD 特有の規制上の課題は次のとおりです。

  • データの質と量: SaMD では、トレーニング、テスト、検証のために、大量の高品質のラベル付きデータが必要です。データが限られていたり偏っていたりすると、不正確または安全でない結果につながる可能性があります。
  • バイアスと公平性: 偏ったトレーニング データは、医療における既存の偏りを永続させたり、悪化させたりする可能性があります。偏りのリスクを最小限に抑えることが重要であり、トレーニング データとアルゴリズムにおける偏りを慎重に分析し、軽減する必要があります。
  • パフォーマンス指標: SaMD のパフォーマンスを評価するための標準化された指標の開発は複雑です。重要でありながら見落とされがちな指標は、多様な患者集団にわたる SaMD の有効性と安全性を測定する一般化です。
  • 継続的な学習: AI/ML SaMD は、新しいデータから学習しながら、時間の経過とともに、監督なしで進化し、適応することができます。これらの継続的に学習するシステムを規制して、安全性と有効性を維持することは、頻繁な規制レビューによって生じる膨大な負担など、多くの理由から大きな課題です。
  • 市販後モニタリング: 市場参入後の AI/ML SaMD パフォーマンスの継続的な監視は、製造業者と規制当局が安全性と有効性の問題が発生したとき(または発生する前に)迅速に特定して対処できるようにするために不可欠です。
  • 規制の一貫性: 地域間で異なる規制要件に対応することは、メーカーにとって困難な課題です。たとえば、EU AI 法は、FDA の医療機器規制に比べて複雑さが増しています。

良いニュースは、FDAが時代の先を進んでおり、規制科学の進歩に積極的に取り組んでいることです。 AI/ML SaMDFDA の最初の取り組みは、2019 年に提案された AI/ML SaMD 規制フレームワークでした。4 このフレームワークはもともと適応型デバイス(つまり、経験や新しいデータを獲得するにつれてその場で自らを修正するアルゴリズム)のみに対処することを目的としていましたが、その後、その考え方は固定 AI/ML SaMD にも広く適用されるようになりました。

この変化は、SaMD の規制を策定するための多面的なアプローチを概説した FDA の 2021 年行動計画で認識されました。この計画には、AI/ML SaMD に特化したカスタマイズされた規制フレームワークの作成が含まれており、次の内容が含まれます。

  • 設計とテストにおいて Good Machine Learning Practices (GMLP) の開発と使用を義務付けます。
  • 透明性を促進する患者中心のアプローチを使用します。
  • アルゴリズムの偏りを最小限に抑え、堅牢性を確保する新しい規制科学手法を作成します。
  • SaMD 監視に製品ライフサイクル全体のアプローチを採用した実際の作業パフォーマンス方法論を開発します。5

計画の概要に沿った FDA の最初の取り組みは 2023 年に始まり、FDA は、事前に決定された変更管理計画 (PCCP) を含む市販前申請の望ましい内容を説明したガイダンス文書の草案を公開しました。6 PCCPは「継続的な学習」のポイントに取り組んでおり、適応型の AI/ML サムエルオー 経験と再訓練を通じて自ら変化する。このシナリオでは、FDAは、市場前申請パッケージ全体の一部として、提案されたPCCPを審査し、 AI/ML サムエルオー 時間の経過とともにどのように変化するか、また製造業者が継続的に安全かつ効果的な機能を検証するかが問題となります。FDA が PCCP に同意した場合、製造業者は FDA に戻って追加の規制審査を受けることなく、自由に変更を加えることができます。(もちろん、FDA が PCCP を拒否した場合、すべての重要な変更は実装前に審査を受ける必要があります。)

PCCP が規制科学の大きな進歩であることは容易に理解できます。おそらくいつか、PCCP は SaMD だけでなくさらに広く使用されるようになるでしょう。デバイスのライフサイクル全体にわたって継続的な安全性と有効性を確保しながら、メーカーと規制当局の規制負担を軽減するプロセスに反対する人がいるでしょうか。

すべて AI/ML SaMD 安全で効果的な SaMD 製品を市場に投入する際に考慮し理解しなければならない、新しい独自の非常に重要な 3 つの側面、すなわち、Good Machine Learning Practices (GMLP)、臨床試験と臨床検証、そしてリアルワールド エビデンスを使用する素晴らしい機会について説明します。

 

優れた機械学習プラクティス (GLMP)

GMLP は、信頼性が高く、効果的で、安全な SaMD を開発するために不可欠です。GMLP の重要な原則は次のとおりです。

  • データ管理: 高品質で多様性があり、代表的なデータを確保します。適切なデータのクリーニング、ラベル付け、拡張が重要です。
  • 機能エンジニアリング: データから意味のある特徴を抽出します。これには、モデルが正確な予測を行うのに役立つ適切な変数を選択することが含まれます。
  • モデルのトレーニングと評価: 堅牢な方法を使用してモデルをトレーニングおよび評価します。これには、クロス検証、ハイパーパラメータの調整、モデルが新しいデータに適切に一般化されることの確認が含まれます。
  • バイアスと公平性: データとモデルの偏りを特定して軽減します。これにより、AI システムが公平になり、特定のグループに不均衡な影響を与えないようにすることができます。
  • 透明性と説明可能性: 解釈可能で、決定を明確に説明するモデルを開発します。これは、信頼を獲得し、説明責任を確保するために重要です。
  • 継続的な監視とメンテナンス: モデルのパフォーマンスを定期的に監視し、必要に応じて更新します。これには、モデルの精度と関連性を維持するために、新しいデータを使用してモデルを再トレーニングすることが含まれます。
  • 企業コンプライアンス: 医療機器に関して FDA が定める規制やガイドラインなど、関連する規制やガイドラインを遵守します。

これらのプラクティスは、機械学習モデルが意図したアプリケーションに対して信頼性が高く、効果的で、安全であることを保証するのに役立ちます。

 

臨床試験

AI 搭載医療機器の臨床試験は、従来の医療機器の臨床試験とはいくつかの重要な点で異なります。

  • データソース: AI デバイスの試験は、多くの場合、遡及的データに依存しており、実際の患者ではなく過去の症例でアルゴリズムをテストすることを意味します。これは、通常は前向きなデータ収集を伴う従来の試験とは対照的です。
  • 試験設計: 従来の医療機器試験では、盲検化とプラセボを用いたランダム化比較試験 (RCT) が使用されることがありますが、医薬品と比較すると、機器試験ではそれほど一般的ではありません。AI 機器試験では、このモデルに厳密に従わず、代わりにアルゴリズムのパフォーマンス メトリックに重点が置かれる場合があります。
  • 適応性: AI デバイスは、継続的な学習を通じて時間の経過とともに進化します。従来のデバイスは承認されると通常は静的になりますが、AI デバイスは継続的な検証と監視を必要とします。
  • エンドポイントとメトリック: AI デバイス試験のエンドポイントは、アルゴリズムの精度、感度、特異性に重点が置かれており、より複雑で多様になる可能性があります。従来のデバイス試験では、臨床エンドポイントはより単純な場合があります。
  • 規制経路: AI デバイスの規制承認プロセスは、アルゴリズムの頻繁な更新と変更を伴う反復的なものになる場合があります。従来のデバイスは通常、より直線的な承認経路をたどります。

 

臨床的検証

臨床検証(ピボタル)研究を設計する際には、以下の追加基準を含めることが重要です。

  • 安全性と有効性: SaMD の臨床研究では、デバイスが実際の臨床現場でその使用目的に沿って安全かつ効果的に機能することを示す必要があります。これには、デバイスが事前に定義されたパフォーマンス基準を満たし、正確な結果をもたらすことを確認するための厳格なテストが含まれます。
  • 一般化可能性: 臨床試験では、 AI/ML サムエルオー さまざまな関連する患者集団や臨床環境にわたって出力を一般化できます。
  • バイアス検出: 試験は、SaMD アルゴリズムの偏りを特定して軽減するように設計する必要があります。これは、さまざまなデータセットでデバイスをテストし、特定の患者グループに不均衡な影響を与えないようにすることで実現できます。
  • 市販後の監視: 市場導入後の継続的な臨床検証は重要であり、SaMD はデータを処理するため、発生する可能性のある問題の検出に役立つ継続的な監視方法を確立することは難しくありません。

これらの側面は臨床検証の概念に新たに追加されたものであり、AI/ML 搭載医療機器の高い基準を維持することに大きく貢献します。

 

現実世界の証拠

最後に、SaMD は、市場導入後に現実世界で自身のパフォーマンスを監視できる独自の立場にあります。SaMD はデータを取り込み、出力するので、デバイスの使用により、事後的に分析できる大規模なデータセットが必然的に作成されます。このリアルワールド エビデンス (RWE) は、継続的な検証、製品設計と改善へのフィードバック、および使用適応症の拡大の可能性において重要な役割を果たします。以下に、いくつかの重要な側面を示します。

  • 現実世界でのパフォーマンス: RWE は、管理された試験環境を超えて、日常の臨床環境で SaMD がどのように機能するかを評価するのに役立ちます。
  • 一般化可能性: RWE は、幅広いソースと患者集団からのデータを使用することで、SaMD がさまざまな人口統計や臨床状態にわたって適切に機能するかどうかを判断するのに役立ちます。
  • バイアスの検出と軽減: RWE は、管理された市販前試験では明らかにならなかったバイアスを明らかにすることができます。この発見は製品設計にフィードバックされ、バイアスを修正し、公平で公正なデバイス性能を確保します。
  • 継続的な学習と改善: RWE は、これらのデバイスを長期にわたって監視および改善するために必要な継続的なデータを提供し、デバイスの精度と信頼性が同等(または向上)であることを保証します。
  • 規制サポート: FDA は、SaMD の承認と市販後調査をサポートするために、RWE をますます受け入れるようになっています。

これらの側面は、AI を活用した医療機器が広範囲にわたる臨床使用において安全かつ効果的であることを保証する上での RWE の重要性を浮き彫りにしています。

 

よくある質問(FAQ)

NAMSA 専門家が、SaMD 製品開発のあらゆる段階でお客様を支援する準備ができています。お気軽にご相談ください。ここでは、さまざまな段階でお客様からよく聞かれる質問をいくつかご紹介します。

私のソフトウェアは医療機器ですか?

ソフトウェアが医療機器の定義を満たしているかどうかは、必ずしも明らかではありません。特に、異常な状態(心不全や細菌など)の存在を特定する場合はそうです。NAMSAの専門家は、お客様と協力して適切なIFU(使用上の注意)ステートメントを作成し、それに続いて該当する機器スペースのランドスケープ調査を実施します。それでも明確でない場合は、 NAMSA お客様と FDA と協力し、お客様の製品に対する最終的な拘束力のある指定を決定します。

SaMD が安全かつ効果的であるという臨床的証拠を収集するにはどうすればよいでしょうか?

SaMD評価は、 NAMSA は、臨床的証拠の生成に対する独創的なアプローチを設計するためにお客様と協力できます。たとえば、デバイスの性能をテストする前向き研究で、遡及的データを使用する機会があるかもしれません。または、市販前と市販後のデータ収集の取り組みを組み合わせる機会があるかもしれません。SaMD 評価では、ランダム化、対照、前向き試験という従来の方法を取る必要がないことがよくあります。

PCCP とは何ですか? また、なぜ PCCP が必要なのでしょうか?

事前変更管理計画 (PCCP) では、SaMD に加える予定の変更内容、それらの変更を実行する方法と時期、SaMD の継続的な安全性と有効性をどのように検証するかを詳細に説明します。PCCP は大変な作業のように思えますが、NAMSA の専門家が FDA の審査と承認を受けた事前変更管理計画の作成をお手伝いします。これは大きなメリットになります。PCCP には次の利点があります。

  • 大きな変更のたびに FDA に戻って繰り返しレビューを受ける必要がなくなり、時間の経過とともに SaMD のパフォーマンスを継続的に向上できるようになります。
  • 自社の投資家や取締役に対し、自社製品の今後の方向性が明確に定義されていることを再確認してもらいます。
  • この記事の執筆時点では、PCCP はまだ非常に新しく斬新なものであるため、自社と自社製品の認知度を高め、競合他社よりも一歩先を行き、前向きに考えていることを示す必要があります。

参考情報

  1. アメリカ合衆国議会。連邦食品・医薬品・化粧品法。30 年 2023 月 26 日にオンラインで公開。2024 年 XNUMX 月 XNUMX 日にアクセス。 https://www.govinfo.gov/content/pkg/COMPS-973/pdf/COMPS-973.pdf
  2. 医療機器・放射線保健センター。医療機器としてのソフトウェア (SaMD)。FDA。4 年 2018 月 26 日。2024 年 XNUMX 月 XNUMX 日にアクセス。 https://www.fda.gov/medical-devices/digital-health-center-excellence/software-medical-device-samd
  3. IMDRF 医療機器としてのソフトウェア (SaMD) ワーキング グループ。 「医療機器としてのソフトウェア」:リスク分類の可能なフレームワークとそれに伴う考慮事項。 2014年30月オンライン公開。
  4. 医療機器・放射線保健センター。人工知能/機械学習 (AI/ML) ベースの医療機器ソフトウェア (SaMD) の変更に関する規制枠組み案 - ディスカッション ペーパーおよびフィードバックの依頼。2019 年にオンラインで公開。16 年 2023 月 XNUMX 日にアクセス。 https://www.fda.gov/media/122535/download?attachment
  5. 医療機器・放射線保健センター。医療機器としてのソフトウェアにおける人工知能と機械学習。FDA。22 年 2021 月 21 日。2023 年 XNUMX 月 XNUMX 日にアクセス。 https://www.fda.gov/medical-devices/software-medical-device-samd/artificial-intelligence-and-machine-learning-software-medical-device
  6. 医療機器・放射線保健センター。人工知能/機械学習 (AI/ML) 対応デバイス ソフトウェア機能の事前決定された変更管理計画に関するマーケティング提出推奨事項。30 年 2023 月 21 日。2023 年 XNUMX 月 XNUMX 日にアクセス。 https://www.fda.gov/regulatory-information/search-fda-guidance-documents/marketing-submission-recommendations-predetermined-change-control-plan-artificial

アダム・ソルトマン

アダム・ソルトマン

認定心臓胸部外科医であるサルトマン博士は、複数の併存疾患を抱える複雑な患者の管理において 25 年以上の経験があります。また、米国 FDA 医療機器・放射線保健センターで医療責任者として 12 年間勤務し、医療機器の導入を成功させる要件、品質システム、コンプライアンス、ベネフィット リスク評価について深い理解を得ました。NAMSA に入社する前、サルトマン博士は XNUMX つの医療機器組織で初の最高医療・規制責任者として業界の経験を積み、その間に XNUMX つの AI 搭載機器の研究開発、臨床検証、規制承認、市場導入を成功させました。サルトマン博士は、ハーバード大学で文学士 (優秀な成績で)、コロンビア大学で医学博士号と博士号 (アルファ オメガ アルファ) を取得しました。さらに、ハーバード/ディーコネス外科サービスで一般および心臓胸部外科の研修を行いました。ソルトマン博士は、イリノイ大学シカゴ校でバイオインフォマティクスの上級研究修了証を取得しており、一般外科、胸部外科、臨床情報学の認定医でもあります。ストーニーブルック大学、マサチューセッツ大学、オハイオ大学で外科准教授を務めました。ソルトマン博士は、不整脈や創傷治癒などのテーマについて、広範囲にわたる研究、講義、出版を行っています。米国外科医師会、米国心臓協会、米国心臓病学会、米国胸部医師会のフェローでもあります。