ディープラーニング(深層学習)などAI(人工知能)技術を利用した医療機器プログラム開発が進むが、これらはデータ学習でプログラムの性能が変化するため、市販後に新たなデータを用いてプログラム学習を行うことで、医療機器承認申請時よりも、プログラム性能が向上または低下する可能性があることが課題となっている。そこで、厚生労働省の次世代医療機器評価指標検討会人工知能分野審査WG(座長:橋爪誠・九州大学名誉教授/北九州中央病院院長)は市販後にプログラム性能が変化する場合の評価について取りまとめ、4月4日、「人工知能技術を利用した医用画像診断支援システムに関する評価指標(改訂案)」を公開した。
同指標の対象は、コンピュータ診断支援(CAD)などの、医用画像に対して、コンピュータで定量的に解析された結果を提示する医師による診断支援にかかるプログラム。具体的には以下の3点の機能を有するシステム全てを対象とした。
ディープラーニングなどの機械学習技術ではデータの学習からプログラムの精度を向上させるため、これらのシステムの市販後に性能を変化させることも可能だ。現状、製造販売承認されている医療機器プログラムで市販後性能変化を前提としたものはないが、今後市場に出てくることが想定されている。同指標ではこうした、データ学習による市販後性能変化を可能とした医療機器プログラムの評価等についての方針を示した。
同指標では性能変化に伴う対応として、継続的な性能検証方法を定めておくこと、また性能変化に伴う品質確保の対策をとることとした。また、薬事上の手続きにおける考え方として、一般にはプログラムの性能向上では再度薬事審査が必要となるが、データ学習による性能変化というAIの特殊性を踏まえたうえでの効率的な手続きの検討が必要とした。
なお、同指標の対象は医薬品医療機器法(薬機法)が定める「医療機器プログラム」だが、同WGでは対象とする、AIを利用して開発したプログラムが、医療機器プログラムに該当するかどうかの判断について検討、その上で、評価指標案を示している。
薬機法の定義では、医療機器は「疾病の診断・治療・予防を目的とするもの」としている。そのため、プログラム医療機器の該当性についても、同様にまずその目的から判断する。一方で、プログラムにより得られた結果が疾病の診断・治療・予防に寄与する程度やリスクによっても、判断が分かれる。同WGではこれらを整理したうえで、医療機器該当性にかかわらず、「使用者の健康にかかわるプログラムの取り扱いに関する提言(案)」をまとめた。
長倉克枝 m3.com編集部