2019年7月24日から26日まで奈良市で開催された第38回日本医用画像工学会のレポートです。
2019年7月24日から26日まで奈良市で開催された第38回日本医用画像工学会で24日、チュートリアル講演会「Beyond Deep Learning」が開催され、東京工業大学特任教授の鈴木賢治氏が「世間の流行に左右されない深層学習所感」と題して講演し、鈴木氏が開発した独自の深層学習モデル「MTANN」による医療画像診断支援への応用について紹介した。
鈴木氏はまず、機械学習や深層学習(ディープラーニング)を巡る現状について紹介した。AIの世界市場予測は、全体で2025年に約45兆円、医療応用に限っては2025年に3.7兆円に伸びるとされており、特にアメリカや中国では、医療AIを扱うスタートアップ企業が多く市場参入している。こうした中で、医療画像に関する機械学習の研究も大きく増えており、鈴木氏自身も2010年から医用画像と機械学習の国際会議を開催したり、論文誌編集に携わったりしてきた。「分野の盛り上がりにしたがって、質の良い論文が増えてきた」とした。
鈴木氏は米イリノイ工科大学にも所属し、長く米国で研究していたため米国のスタートアップ事情にも詳しい。「医療AI市場は莫大なため、米国ではシリーズAでもベンチャーキャピタル(VC)は40億円くらいならパッと出す」とした一方で、日本はスタートアップ育成の土壌がないため、米国と比べると医療AI分野のスタートアップ企業は非常に少ないと課題を指摘した。「大企業ではリスクが取れない。AI診断となるとあらゆる疾患について大企業が網羅的にやっていくのは不可能。やはりスタートアップ企業を立ち上げる必要がある」とした。
機械学習の医療分野での応用では、コンピューター診断支援(CAD)が挙げられる。CADは、最近では「AIドクター」と呼ばれることもあるが、医用画像をコンピューターに入れるとAIが解析し、セカンドオピニオンとして結果を医師に提示し、医師が最終的に診断をする。
こうしたCADは深層学習以前にも機械学習で取り組まれてきた。機械学習ではまず医用画像を特定の領域に分割する「セグメンテーション」を行い、それから病変などを示す特徴量を抽出して識別している。ただし、感度は高くても、偽陽性が多く、実際に臨床応用するには精度が不十分という課題があった。その理由として鈴木氏は「正常構造の認識に弱い」とした。
一方で、深層学習ではセグメンテーションや特徴量分類というプロセスを経るのではなく、画像と最終的な判定結果となるラベルと直接紐づけて学習する。深層学習は2012年に画像認識プログラムを競うコンテストで優勝した畳み込みニューラルネットワーク(CNN)のモデルが有名だが、鈴木氏は2003年に深層学習モデルのひとつである「MTANN(massive-training artificial neural network)」を提案。胸部CT画像から肺結節の検出などの研究を進めてきた。
一般に、深層学習では学習のために大量の学習データが必要とされる。深層学習を使った画像診断支援が一躍注目を集めた2017年に「Nature」に発表された皮膚がんの識別では、141万枚の学習データ(13万枚の医用画像と128万枚の自然画像)を利用している。ただ、医用画像では多くの場合大量の症例を収集するのが困難であるため、学習データ不足は深刻な問題だ。仮に画像データが集まっても、ラベル付け(アノテーション)に膨大な作業が必要となる。また、深層学習では膨大な演算が必要となるためパワーの大きなGPUが必要となる。
一方で、鈴木氏が提案するMTANNは、例えばCTからの肺がん検出で病変あり画像が10例、正常画像が90例と非常に少ない学習データからも、高精度で検出することができたという。
深層学習モデルでは深い層の階層型ニューラルネットワークを用いるが、「層は深ければ深いほどよい」と考えている人も少なくなく、これは間違いだと鈴木氏は指摘。「(医用画像で病変検知する場合)局所性病変の識別には、十分広いCNNなら二層で十分という結果が出ている」という。むしろ必要以上に深い層を持つ深層学習モデルを用いると、大規模学習が必要となるだけでなく、性能を落とす可能性もあるという。つまり、適切な深さのモデルを使うべきだとした。また、MTANNではシンプルな構造をしており必要以上に層が深くなっていないため、少ない症例数で高精度の識別が可能になると説明した。
MTANNのソースコードについて、鈴木氏自身は公開したいと考えているが、現在は権利関係の課題があり公開していない。共同研究での利用であれば共同研究先も利用できるという。
長倉克枝 m3.com編集部