糖尿病性網膜症を判定する医療機器の販売が米国食品医薬品局(FDA)に承認されるなど、今、人工知能(AI)を用いた画像診断支援システムの開発がめまぐるしく進んでいます。果たしてAIは医療現場をどのように変えるのでしょうか。 シリーズ「AIは医師を超えるか」は、『人工知能の哲学』や『人工知能はなぜ椅子に座れないのか』などを著した松田雄馬氏が、AIの仕組みから応用までやさしく解説する全5回の連載です。
前回 は、ニューラルネットワークを用いてリンゴやミカンの写る画像の特徴を学習することによって「分類」する方法について簡単に紹介した。このニューラルネットワークを用いることで、内視鏡画像から大腸癌を認識する画像診断システムなどが開発されている。今回はこの仕組み、すなわち機械にとっての「目」の仕組みについて理解することで、画像診断システムが誤認識を起こしてしまう理由について検討していく。これを理解することで、画像診断システムの精度を改善していく方法が考えられるだけでなく、システムのメリットとデメリットを理解したうえでの利活用が進んでいくものと考えられる。
機械の目である「カメラ」(特にデジタルカメラ)のレンズの仕組みと、人間の目の中の「網膜」の仕組みはよく似ている。カメラのレンズに投影された映像は、格子状に並んだ画像センサーに投影される。こうして、実空間上の映像は格子状に並んだ画素(ピクセル)の集まりとして表現される。人間の目に入る光もまた、網膜に並ぶ網膜細胞に投影される。すなわち、機械の目も人間の目も、画素(ピクセル)の集まりとして外界を捉えるのである。
しかし機械の目は、そこにあるものを映しているだけであって、物体を「見ている」とまでは言えない。画素に光が表現されているだけでは、どこにどんな物体があって、どのような様子か(どのような姿勢でどのように動いているか)を理解することは極めて困難である。下の右写真を見ると、私たちの目には「二頭の馬が草を食べている様子」が見える。しかし機械の目には、拡大した左側の図のように無味乾燥なピクセルの羅列が映るのみであり、「どこからどこまでが馬なのか」「あるピクセルと隣のピクセルがどういった関係なのか」といった情報は何も読み取れないのである。
ではこうした状況で、人間はどうやってものを見ているのかを説明する前に、機械がどのようにものを見ているかについて、前回説明したニューラルネットワークの仕組みを少し異なった角度から説明し直してみたい。ニューラルネットワークの「ものを見る」仕組みと人間のそれを比較することで、画像診断システムが誤認識を起こす理由が見えてくる。
ニューラルネットワークによって特徴を学習した後、それぞれの画像はどのように表現されるのだろうか。下の図は、馬を含む画像と含まない画像が、ニューラルネットワークによって分類されていく様子を模式的に示している(ここでは、「主成分分析」という手法を用いて特徴を二次元で可視化した)。
ここでは数学的な説明は避けるが、前回紹介したニューラルネットワークにおけるシナプス結合の強弱が図の縦軸や横軸に対応するため、画像を学習した結果として、このように馬が「あるとき」と「ないとき」とで、二つの群に分けることができるのである。
先ほどのグラフを見るとわかるように、馬が「あるとき」と「ないとき」は、はっきりとした群に分かれてはいるものの、その群は雲のように幅を持っている。そしてその幅は、学習する画像データが増えていくと重なり合ってしまう場合も生じてくる。逆に学習する画像データが少なすぎる場合には、たまたまデータが雲の端に偏りすぎてしまうことで、本来は「馬があるとき」の群に分類されるはずが「馬がないとき」に分類されてしまうというような場合も往々にして生じうる。
このように、画像診断における誤りが生じてしまうケースは次の二つのケースに大きく分けられる。
ⅰ)学習するデータが増えることで群が重なり、分けられない領域が出現する
ⅱ)学習するデータが少なすぎることで、群の位置を見誤り、分類自体を誤ってしまう
前者に関しては、ニューラルネットワークをはじめとする「確率論(統計論)的学習理論」による分類を行う以上、ある一定確率で必ず生じることが原理的に避けられない。後者に関してはさらに深刻である。画像データが豊富に取得できる場合に関しては問題になりにくいが、医療画像をはじめとする専門的な機器を要する画像の取得は、時間、労力、コストなどが見合わず、断念せざるを得ない場合も少なくない。これが、医療AIの開発が難しい一つの要因である 。
では、データが増えすぎてしまった場合や少なすぎる場合には、どのような処理を行うのが適切なのだろうか。こうした、画像の認識に関する何らかのシステムを開発する場合に常にヒントになるのは「人間の認識」である。次回は、人間の持つ認識能力をヒントにして、ニューラルネットワークを改善していく方法について、いくつか分かりやすいものを紹介していく。
(1)人工知能」が医療現場にもたらすもの(2018年9月13日公開)
(2)人工知能はいかにして癌を認識するのか (2018年9月14日公開)
(3)画像診断による誤りは、どのようにして生じるのか(2018年9月15日公開)
(4)人間の認識能力が画像診断システムの限界を突破する(2018年9月18日公開)
(5)人工知能は人間の仕事を奪うのか(2018年9月19日公開)
松田雄馬
1982年生まれ。博士(工学)。京都大学工学部地球工学科卒。2007年日本電気株式会社(NEC)中央研究所に入所。MITメディアラボやハチソン香港との共同研究に従事した後、東北大学とブレインウェア(脳型コンピュータ)に関する共同研究プロジェクトを立ち上げ、基礎研究を行うとともに社会実装にも着手。2016年、NECを退職し、独立。現在、「知能」や「生命」に関する研究を行うとともに、2017年4月、同分野における研究開発を行う合同会社アイキュベーターを設立。代表社員。