1. m3.com
  2. AI Lab
  3. ニュース
  4. 胸部CT画像からCOVID-19を高精度に同定 ―轟・加藤の「医療AI ト...

AI Lab プロジェクト医療×AIの発展にご協力いただける方を募集しています

胸部CT画像からCOVID-19を高精度に同定 ―轟・加藤の「医療AI トレンドを追う」(15)

2020年4月15日(水)

アイリス株式会社AIエンジニアの轟佳大氏が、眼科専門医でデジタルハリウッド大学大学院客員教授の加藤浩晃氏と共に、企業や大学における医療AI開発の取り組みを紹介する連載コラムです。取り上げてほしいテーマや質問事項、記事の感想などございましたら、「m3com-editors@m3.com」までメールをお送りください。

» 連載1回目から読む


ななめ読み
・新型コロナウイルス感染症(COVID-19)を題材としている医用画像系論文やデータセットを複数紹介します。
・2020年2月に発表された「正常肺、インフルエンザ性肺炎、新型コロナウイルス(SARS-CoV-2)による肺炎の3クラス分類をする研究」は、とりわけ研究と論文化の速度が非常に速かった論文です。
・2020年3月の1カ月のみで20本近くのCOVID-19関連研究が発表されました。


日々現場でSARS-CoV-2と対峙されている医療従事者の方々に敬意を示し、自身も感染しないように、またエンジニアとして今できることを引き続きやっていこうと思います。

今回紹介するのは2020年2月21日に公開された論文「Deep Learning System to Screen Coronavirus Disease 2019 Pneumonia」です。これは、胸部CT画像からSARS-CoV-2による肺炎、インフルエンザA型による肺炎、正常肺を3クラス分類する研究です。研究グループは浙江大学の研究ユニットチームで、比較的シンプルな深層学習モデルを用いた3クラス分類を実現しました(SARS-CoV-2による肺炎の正解精度86.7%)。

2019年12月に中国・武漢にてCOVID-19の発症が確認された後、2020年1月24日に41名の罹患者の症状を基にしたクリニカルレポートが発表され、その約1カ月後に本研究が論文として発表されました。すべてにおける研究スピードがとてつもなく速い印象です。

胸部CT画像618症例を使用

本研究のために、胸部CT画像618症例が浙江大学付属病院にて集められました。内訳としては219症例(110名の患者から撮影)のCOVID-19罹患者の胸部CT画像、224症例(224名の患者から撮影)のインフルエンザA型肺炎罹患者のCT画像、そして175症例の正常肺が映るCT画像です。

それらの胸部CT画像について、528症例(189症例のCOVID-19、194症例のインフルエンザA型、145症例の健常肺) をトレーニング用とバリデーション用に振り分け、残りをテスト用とします。

3次元データを2次元データとして扱うために、618症例からサイズ60×60×60のボクセルデータ(3次元データ)で病変候補部位3957点を抽出したのちに、ボクセルデータから60×60の2次元パッチ画像を切り出します。トレーニングとバリデーションに用いた528症例からは合計1万161枚の2次元パッチ画像を切り抜き用意しました。(2301枚のCOVID-19による肺炎病状部位画像、2244枚のインフルエンザA型による肺炎病床部位画像、そして5616枚の正常肺部位画像)

COVID-19の30症例中26症例を的中

今回使用したモデルはResNet18をベースに畳み込み層と全結合層を加えたシンプルなモデルとなっています。入力画像は2次元パッチ画像です。入力したパッチ画像に対して3クラス分類を行います。注目すべき点は全結合層2層目に1次元の「エッジからの相対距離」情報を結合させることで、各画像にCOVID-19に関する比較情報を付与したところです。

todoroki

図1.モデル図詳細

この「エッジからの相対距離」は、「胸膜付近に発生している陰影はCOVID-19の可能性が高い」という臨床情報を基に、パッチ画像のエッジから中心までの距離(図2 c)と胸部全体の対角線状の距離(図2 d)にて比率計算を行っています。

todoroki2

図2.エッジからの相対距離イメージ図

結果

todoroki3

todoroki5

各クラスのconfusion matrixと評価指標である再現率、精度、F値は上図の通りとなりました。confusion matrixにおいて、COVID-19は30症例中26症例が的中しており、再現率86.7%、精度81.3%を達成しました。また展望としてはCOVID-19の臨床診断には、患者の接触歴、渡航歴、初発症状、検査室検査を組み合わせて診断する必要があることや、大規模なデータセットの必要性などが言及されていました。

3月以降にCOVID-19×AIの論文は20本以上

今回紹介した論文は2020年2月21日に発表された論文でしたが、その他にも3月以降に20本以上のCOVID-19を題材とした医用画像×機械学習・深層学習に関する論文が発表されています。

たとえば3月19日に発表されたAUC0.95に到達した研究や、3月20日に発表された機械学習ベースの研究、また3月24日に発表された深層学習ベース(ImageNetで学習した ResNet50/InceptionV3/Inception-ResNetV2)の比較実験研究などが挙げられます。

また、3月16日からgithub上にて「X線で撮影されたCOVID-19画像」と「罹患した患者のメタデータ」に関するパブリックデータセットも公開され始めました。さらに、Googleも3月31日にGoogle CloudにてCOVID-19に関するAI学習用のパブリックデータセットを公開することを発表しました。この中では、ジョンズ・ホプキンス大学が発表しているオープンデータや、世界銀行が発表しているオープンデータなどを含め公開していくそうです。このように全世界の医療従事者やエンジニア、研究者が技術と知識を融合させて早期解決に向けて挑戦をしています。

今回もありがとうございました。日本のみならず、世界の様々な場所で分野の異なる専門家がタッグを組みながら、周りの人の命を守るために懸命に自分ができる事を行っている世界に共感しました。現在世界的に未曾有の事態だからこそありとあらゆるリソースを使い早期収束に持ち込みたいですね。

では次回もお楽しみに。

轟佳大

轟佳大

アイリス株式会社 AIエンジニア。1992年生まれ、立命館大学大学院 情報理工学研究科修了。大学・大学院を通して医療AIの研究を行い、大学院在学中にはシンガポール国立情報研究所にて医療AIの研究に従事。最新論文は医工学分野のトップカンファレンスに採択された。研究や仕事の傍ら、医学生や医師、社会人向けに医療AIの講演などを行っており、スライド「AI×医用画像の現状と可能性」(http://ur0.work/SfKm)は1万viewを超える。医療と最新テクノロジーとアイスが好き。

このシリーズの記事