ツカザキ病院眼科で眼科医兼人工知能エンジニアのチーフとして働く升本浩紀氏が、自らのAI開発の経験をベースに、医療AIの現状について紹介する連載コラムです。
第2回の連載で、画像AIには識別、回帰、物体検知、segmentation、生成の大きく分けて5つのタスクがあると紹介しました。今回は、その中の「識別」について詳しく掘り下げていこうと思います。
我々はこれまで、「超広角眼底撮影装置(Optos)」で撮影した画像を用いた各種疾患のAI診断論文を発表してきました。初めて発表したAI診断論文は、正常眼のOptos画像と、網膜剥離眼のOptos画像を識別するというものでした。
網膜剥離は、特に 胞状( ブーラス状 )の剥離領域があった場合、非常に所見が目立つため、近年のニューラルネットワークでは高精度で識別を行うことができます。しかし、このAIには非常に大きな問題があります。というのも、正常と網膜剥離以外の所見をもつ眼底画像に対する挙動が一切予測できないのです。
例えば、上の画像のような正常でも網膜剥離でもない、しかし明らかに正常ではなさそうな眼底画像の場合です。「網膜剥離眼と正常眼以外の眼底所見は存在しない」というような、限定された条件のことを「枠(フレーム)」と言います。このようにフレームの中だけで思考(演算)することにおいて、AIは非常に高速であり、かつ精度も高く行えます。しかし、現実世界では、ありとあらゆる疾患が現れる可能性がありますし、そもそも眼底がきちんと撮影されていない場合すらあります。
では、このようなフレーム問題を抱えているAIは実用的ではないのでしょうか?
私の考えとしては、
1. そもそもAIを限局されたシーンで使う
2. フレームを極力広く取る
3. 距離学習
という3つの解決策があると考えています。
解決策の一つとして、ある程度画一化された条件のデータにのみAIを適用することが挙げられます。例えば、人間が先にデータを確認し、明らかに他の病気がないかを確認した上で問題がない場合、もしくは問題を限局した上で、それ専用のモデルに「確認」をさせるという運用を行うという例です。この場合には、フレーム問題をほぼ除外できた上でAIを活用できるように思います。
しかし、この解決手法の場合に得られるメリットは、医師とAIのタブルチェック、つまり信頼性向上効果であり、労務コスト改善効果はほぼありません。
眼科においては網膜剥離、緑内障、糖尿病網膜症、加齢黄斑変性、白内障眼底など、ある程度重要疾患を限定することは可能です。そして、AIによってこれらの「想定疾患」のみを識別することは不可能ではありません。しかし、想定疾患に限定したとしても、所見のバリエーションが非常に幅広く、全てを網羅するようにデータセットを構築することは困難です。
例えば次の例を見てみましょう。我々が主に使用しているデバイスであるOptosは、比較的大規模な施設に多く設置されています。糖尿病網膜症の重症な患者はOptosで撮影される前に、他の施設である程度レーザー治療を受けており、それでもコントロール不十分であるため、大規模施設に紹介されるケースが多くを占めます。そのため、Optosで撮影されている重症糖尿病網膜症患者の眼底画像は、そのほとんどがレーザー照射後です。つまり、Optosで撮影された糖尿病網膜症の眼底画像は、ほとんどが治療必要性のない軽症例か、レーザー照射後の重症例になってしまいます。このように網羅性の高いデータセットを構築することは非常に困難なのです。
「Metric Learning(距離学習)」と呼ばれる手法があります。これは、データ間の“距離”を学習する手法です。例えば下の画像だと、スニーカー同士は比較的近い距離にあるが、スニーカーとハイヒールは遠い距離にあることがわかります。
診断支援AIにおいては、同じ診断は比較的距離が近くなり、異なる診断は距離が遠くなるように学習するAIといえるでしょう。このような、普通に識別するだけのAIではなく、距離を測定するAIを用いることで、明らかに異常だがAIにとっては未知である疾患の画像に対して、何らかの異常を指摘するように設計できる可能性が高いと言えます。
連載5回目の今回は、社会実装の際に問題となるフレーム問題の紹介およびそれを乗り越える方法について紹介しました。このような問題について一つ一つ工夫しながら乗り越えることこそ、AI開発において最も大事なのではないかと考えています。
升本浩紀 ツカザキ病院 眼科 医師/株式会社シンクアウト 最高技術責任者
2016年 東京大学医学部卒業。在学中に中小企業診断士や公認会計士試験に合格。2018年からツカザキ病院。眼科医として臨床を行う傍ら、医療AIの研究・開発に取り組んでいる。日本眼科AIのトップランナーとして国内外の学会や、医師、医学生向けの講演をを多く行っている。関心領域はオペレーションマネージメントや、スマートフォンを用いたビジネス。好きな人工知能フレームワークはPyTorch。