糖尿病網膜症を眼底画像から早期発見、精度98.2％

m3.com
AI Lab
ニュース
糖尿病網膜症を眼底画像から早期発見、精度98.2％

AI Lab プロジェクト医療×AIの発展にご協力いただける方を募集しています

糖尿病網膜症を眼底画像から早期発見、精度98.2％

2019年2月7日（木）

AIに関連する医学論文をご紹介します。

糖尿病網膜症につながる眼底の滲出液の早期発見に役立つ機械学習を、ロイヤルメルボルン工科大学のParham Khojastehらの研究チームが特定した。眼底画像の診断による滲出液の自動検出にはこれまで畳み込みニューラルネットワーク（CNN）モデルが利用されてきたが、十分な精度が得られていなかった。研究チームは公開されている２つの画像データベースを使って複数の深層学習モデルを比較し、サポート・べクター・マシンを合わせた事前学習済み残差ネットワーク（ResNet-50）のモデルが精度98％、感度0.99とほかよりも高い性能を発揮できることを突き止めた。研究成果を網膜への滲出液の早期発見に役立てたいとしている。

研究成果 Exudate detection in fundus images using deeply-learnable featuresはComputers in Biology and Medicineの１月号に掲載された。

糖尿病網膜症を発見できずに放置してしまうと、視覚の障害や視力を失う原因になる可能性があるが、早期発見によって確率を50％低減できるとされている。糖尿病網膜症の初期に現れる症状の1つが網膜の滲出液の存在だが、専門医が1人1人の患者を診察するのは時間がかかる。眼底画像から自動的に診断できれば多くの症例の早期発見や遠隔診断に貢献できるが、画像撮影時の照明の具合、画像のコントラスト、滲出液の大きさ、色、形、質感などにバラつきがあるため難しい。これまでもさまざまな手法の画像解析や機械学習モデルが提案されてきたが、診断を支援する十分な性能を発揮できなかった。また、深層学習の適用を目指す研究開発も進められてきたが、感度が不十分だったり特異度が不十分だったり、事前の画像処理の作業が煩雑だったりとした。CNNモデルを利用する場合は、ネットワークのパラメータを設定する必要があるが、決まった設定方法がないため経験則に頼ることになり、また、学習に使えるデータが多く必要という課題もあった。医療の分野ではデータの量に制約がある場合もあり、大量のデータを必要としない別の深層学習システムの探求が必要だった。

研究チームは、CNNモデル、教師付き学習で事前学習済みの残差ネットワーク（ResNet-50）、識別的制限付きボルツマンマシン（DRBM）の3種類の深層学習の手法を比較した。また、ResNet-50には3種類の教師付き分類器を組み合わせた：サポート・ベクター・マシン、最適経路森林問題の手法、ｋ近傍法だ。CNNモデルは特徴を抽出するための畳み込みカーネルと分類を実施する層で構成される。今回は４層の畳み込み層を使い、各層には大きさが３×３ピクセルの特徴マップを16含めた。深層残差ネットワークでは畳み込み層が事前の学習をしているため、大量のデータを使わなくて済むというメリットがある。研究チームは、ImageNetのデータセットを使って事前学習をしたResNet-50の全結合ソフトマックス層を3種類の教師付き分類器に置き換えて今回の比較研究に利用した。サポート・ベクター・マシンは非確率論的な線形の2クラス分類識別器で、最適経路森林問題の手法はグラフに基づく教師付き分類を進め、ｋ近傍法は調べたいデータと最も近い学習データを探し出して分類するという特徴がそれぞれある。そしてDRBMは、入力と出力の関係をデータから学習していく教師なしの計算モデルだ。

眼底の画像89枚を収容しているDIARETDB1と、e-Ophthaという眼底の画像47枚を含む２つの公開されているデータベースを使って、各モデルの学習と性能評価を実施した。画像から滲出液の領域を抽出し、外れ値のもの以外を全て拾い出せるように、滲出液が見られた最小の領域25ピクセル×25ピクセルの大きさの領域を判定するようにした。また、手作業で滲出液を含む全領域を特定したところ、DIARETDB1の全画像から67,600カ所、e-Ophthaからは23,200カ所見つかった。それぞれ滲出液がない70,000の領域と25,000の領域と合わせて画像データ一式とした。各システムの評価には、10分割交差検証の10回繰り返しを用いた。

精度、感度、特異度を指標にしてそれぞれの手法を評価したところ、データベースによる違いはないことが分かった。データベースDIARETDB1を使った時、サポート・ベクター・マシンと合わせたResNet-50は感度0.99、精度98.2％と2つの指標で最も高い性能を発揮し、特異度は最適経路森林問題と合わせたResNet-50が0.99と最も高かった。もう1つのe-Ophthaデータベースでもサポート・ベクター・マシンと合わせたResNet-50が精度97.6％、感度0.98、特異度0.95と高い性能を示した。2つのデータベースのいずれかを使った深層学習による自動診断の過去の研究成果と比較しても、サポート・ベクター・マシンと合わせたResNet-50の方がほとんどの指標で上回っていた。

残り2つのモデルのうち、CNNモデルはどちらのデータベースでも精度が90％前後、DRBMは7割台と性能を発揮できなかった。これは、パラメータの設定に決まった方法がないため、経験則に頼らざるを得ないということが影響していると考えられる。また、サポート・ベクター・マシンと合わせたResNet-50が学習のために大きなデータベースを必要としないのに対して、2つのモデルは十分な学習ができなかった可能性もあるという。

今回の比較で得られた結果には有意差があり、サポート・ベクター・マシンと合わせたResNet-50が最適な手法となったものの、研究チームはさらなる改善の余地があるとみている。ほかの深層学習モデルについても検討していくという。