AIに関連する医学論文をご紹介します。
18F-FDG(フルデオキシグルコース)を使った脳のPET(陽電子放出断層撮影)検査画像を使い、米国・カルフォルニア大学のYiming Dingらはアルツハイマー病の発症予測をするためのディープラーニングのモデルを開発した。過去に撮影された最終的な診断が下される前の患者の脳の画像情報でモデルの性能を試すと特異度100%が得られる時の感度は82%で、実際の最終診断よりも平均して75.8カ月前に発症を予測することができた。
アルツハイマー病の進行の抑制には早期発見と早期の対処が効果的で、そのための18F-FDGを使ったPET検査画像の利用は浸透してきているが、認知機能に障害が出ない人、軽度認知障害(MCI)でとどまる場合、アルツハイマー病の発症まで進行してしまう一部の人を核医学や神経画像の専門家が正確に区別して予測するのは難しい。また、βアミロイドの検出など、アルツハイマー病の早期発見のための新技術は開発されてきているが、高価で誰もが利用できるものとしてはまだ普及していない。同手法はほかの検査などと組み合わせてアルツハイマー病の前兆の早期発見につなげる有効な方法になりうると研究チームはみている。
研究グループは、過去のアルツハイマー病の画像診断の研究で収集した1002人の2109枚のPET画像を活用した。このうち、収集した画像全体の90%に当たる899人の1921枚の画像を使って各診断結果の予測につながる特徴をアルゴリズムに学習させた。残り10%の画像と、研究グループが所属する研究機関で独自に収集した別の40人の患者の40枚の画像を使って、アルゴリズムの性能を調べた。各画像を分析し、いずれアルツハイマー病を発症するものである確率、MCIになる確率、アルツハイマー病にもMCIにもならない確率と3群でそれぞれ確率を算出し、最も高いものを予測結果とした。また、臨床の現場での診断と比較するために、核医学や画像診断の専門家3人も同じ40枚の画像セットの解析を行った。3人の結果が一致しない場合はさらに追加で2人が解析し、多数決で最終的な診断結果を決めた。
アルゴリズムが残り10%の画像を解析した結果からROC(受信者動作特性)曲線を描いたところ、AUC(曲線下面積)はアルツハイマー病の予測では0.92、MCIでは 0.63、認知機能の障害がない場合では0.73となった。この結果から、アルゴリズムはアルツハイマー病になる症例をMCIや認知機能障害がない症例のほか2群からは区別することができるものの、MCIをほか2群から見分ける能力はやや劣ることが判明した。アルツハイマー病、MCI、認知機能障害なしのそれぞれについて、感度は81%(29/36)、54%(43/79)、59%(43/73)、特異度は94%(143/152)、68%(74/109)、75%(86/115)、精度は76%(20/38)、55%(43/78)、60%(43/72)だった。 アルゴリズムと臨床医の結果を比較するために、次にアルゴリズムが40枚の画像セットを解析した結果からROC曲線を95%信頼区間で描いた。アルツハイマー病、MCI、認知機能障害なしの3群について、AUCはそれぞれ0.98 (95%信頼区間:0.94 1.00)、0.52 (95%信頼区間:0.34 0.71)、0.84(95%信頼区間:0.70 0.99)となった。また、感度についてはそれぞれ100%(7/7)、43%(3/7)、35%(9/26)、特異度は82%(27/33)、58% (19/33)、93% (13/14)、精度は54%(7/13)、18%(3/17)、90%(9/10) だった。
アルツハイマー病発症の予測は感度が100%で特異度もある程度高いため、このモデルには画像撮影後から平均して76か月後に行われた最終的な診断に先駆けて結果を予測する能力があると研究グループはみている。一方の臨床医による画像解析では、アルツハイマー病の発症、MCI、認知機能障害なしの2群について、それぞれ順番に感度は57%(4/7)、14%(1/7)、77%(20/26)、特異度は91%(30/33)、76%(25/33)、71%(10/14)、そして精度 57%(4/7)、11%(1/9)、83%(20/24)だった。
アルツハイマー病の予測について、臨床医の結果はアルゴリズムのROC曲線を下回り、95%信頼区間からも外れていた。MCIと認知機能障害なしという診断については、臨床医の結果はアルゴリズムのROC曲線の近くにあり、95%信頼区間の中に収まっていた。こうした比較から、アルゴリズムは臨床医と比較して、アルツハイマー病を発症してしまう症例については統計的に有意により正しく見分けることができたとしている。一方のMCIは臨床医の方が正しく見分け、認知機能障害がない症例についてはアルゴリズムの方が正しく見分けたが、統計的に有意差はなかったとしている。
鴻知佳子 ライター
大学で人類学、大学院で脳科学を学んだ後、新聞社に就職。バイオを中心とする科学技術の関連分野を主に取材する。約10年の勤務後に退社。ずっと興味があった現代アートについて留学して学び、現在はアートと科学技術の両方を堪能する方法を模索中。