医師ら医療者自身がデータやプログラムを扱い、医療データを活用する取り組みが進みつつある。本シリーズでは、データサイエンスやAIなどを学ぶ医師ら医療者に、その具体的な取り組みについてお伺いします。
2019年12月に開催された日本循環器学会関東甲信越地方会で、東京大学医学部医学科6年の松本卓也氏が、「深層学習を用いた胸部X線画像の心不全診断」について発表し、優秀賞を受賞した。松本氏は東京大学医学部附属病院循環器内科の医師らと研究に取り組む中で、独学でディープラーニング(深層学習)を学んだという。医師免許取得後は、4月から初期研修医として臨床に携わっていく。AI(人工知能)を使った研究を始めた経緯、今後について松本氏にお伺いした(2019年12月23日にインタビュー)。
AI研究を始められた経緯をお伺いできますか。
2018年春くらいに「循環器の教科書を学生で作ろう」というプロジェクトがあり、興味があったので参加しました。それがきっかけで、東大病院循環器内科助教の小寺聡先生と知り合い、循環器内科で臨床研究を始めることになりました(『医師がゼロからAI学ぶ、半年で論文投稿―東京大学医学部附属病院循環器内科助教の小寺聡氏講演レポート』参照)。当初はAIをやっていたわけではないのですが、2019年春くらいに小寺先生からディープラーニングを使った研究のプロジェクトに声をかけていただきました。
もともとディープラーニングには興味がありましたが、一人ではどうしていいか分からなかったのですが、これをきっかけに勉強を始めることにしました。また、ちょうど留学から帰ってきたところだったのですが、留学先の病院でディープラーニングを使った研究を目の当たりにして、医師だからといってやらなくていいわけではなく、医師のひとつのスキルとしてディープラーニングをできるようになった方がいいと感じ、焦りがありました。
留学はどちらに行かれたのですか?
ハーバード大学の関連病院であるマサチューセッツ総合病院(MGH)です。東大には、自由に実習先を選んで実習に行くと単位を取れるプログラムがあります。もともと海外の病院に関心があったので応募し、MGHの救急科で1か月間実習しました。
MGH救急科では、ディープラーニングを使ったデータ解析などをされている、長谷川耕平先生の研究室にお世話になりました。長谷川研では、AIでの解析で医療現場の負担を減らせるといった研究もありました。例えば心電図の波形を機械学習し、本当に看護師を呼ばないといけない時だけナースコールを自動で鳴らすといったシステムです。
MGHでは医師も積極的に解析に関わられていたのでしょうか?
長谷川研で案内してくださった先生は、日本で医師免許を取って、アメリカで医療統計家として解析をメインにされていました。もちろん工学部出身のエンジニアリングの専門家もいますが、日本と比べて生物統計の専門家がかなり多い印象でした。医療とエンジニアリングの懸け橋になる先生がとても重宝されており、多様な専門家が関わっていることが印象的でした。
松本さんがディープラーニングの勉強を始められたのはいつからでしょうか?
6月に留学から帰国して、教科書を使って1か月ほど独学で勉強しました。自分でディープラーニングをやってみる教科書2冊と、Keras(Pythonで書かれたオープンニューラルネットワークライブラリ)を使うことになったので、Kerasの本、ディープラーニングの理論の本の計4冊です。このうち2冊は小寺先生から紹介していただき、他の2冊は書店で探して選びました。
以前からプログラムを書かれていたのでしょうか?
それまでは自分でプログラミングはしていませんでした。Texやhtmlには慣れていましたが、Pythonは初めて勉強しました。基本は独学で、プログラミングに詰まって調べても分からない時は、工学部などでプログラミングに詳しい友人に質問して教えてもらいました。
独学で勉強してから実際に研究を始められた。研究の概要を教えてください。 胸部X線画像からディープラーニングを用いて心不全の有無を判断するという研究なのですが、500症例と少ないデータセットで感度82%と高精度で判別することができました。
米国立衛生研究所(NIH)が公開している胸部X線画像のデータセット(NIHのページはこちら)を使ったのですが、このデータセットは画像に診断名があらかじめラベル付けされているのですが、これが間違っているものがあるので、実際に循環器内科の医師が読影して間違っているものを排除していきました。その上で、CNN(畳み込みニューラルネットワーク)のモデルに入力して学習させました。モデルは、あらかじめVGG16で転移学習させることで、少ないデータ数でも精度が高くなりました。
実際にやってみていかがでしたか?
ゼロから始めたので、何をすればアキュラシーが上がるのかが最初はわかりませんでした。アキュラシーが上がったと思っても、実は過学習が起きていたということもありました。試行錯誤しましたが、振り返るとすごい技術をやったというよりも、既存の技術を積み上げて使っただけです。やっているうちに壁がありましたが、そういう時に詳しい人に教えてもらうとやりやすかったと思います。
東大医学部にはIT研究会もありますが、周囲の同級生でプログラミングをやっている人は多いのでしょうか?
すごいな、と思うほどやっているのは1学年に2~3人はいますが、やっている人は10人くらいいると思います。興味があり必要性を感じている医学生はもっと多いでしょう。2020年からはプログラミング教育が小学校で必修化されますが、医学部に入ってもプログラミングは必須スキルになります。置いていかれないようにと今から思う人も多いと思います。
医師でもプログラミングができる方がよいのですね。
できた方が自分の研究の幅が広がります。最近では、普通のパソコンでもオンラインの環境を使って簡単に解析ができます。また多くのオープンデータがあるので、誰でも大規模データを取得できます。スキルがあれば、臨床現場で気づいたリサーチクエスチョンから、自分のパソコンで解析できるという魅力は大きいです。
一方プログラミングばかりやっていても、臨床の現場でどう応用していかわからなくなります。臨床の現場にいながら、プログラミングの最低限のスキルがあると、どういったことに応用できるかがわかります。AIというのは得体の知れないものではなく、うまくやれば人間の医師の機能を拡張するものだと考えています。
AIでは、日本は国全体として世界から後れを取っています。できる人が多ければ多いほど、次の世代も育ちますが、独力だけでは難しい。最初に数人できる人がいれば、その後も育っていきやすいです。自分が必要最低限のスキルを身に付けたので、教えたり教えあったりして日本全体の医師のAIスキルアップにつながればと考えています。
今後について教えてください。
まずは国家試験を受け、医師免許取得後の4月からは初期臨床研修に進みます。将来いずれは研究に携われたらよいと思っていますが、まず臨床経験を積んでからの方が良いリサーチクエスチョンが出てきて、研究をするモチベーションにつながると思います。診療科は、今お世話になっている循環器内科を志望していますが、それにこだわらず、何でも受け入れるつもりで臨床経験を積んで、人生懸けてもいいと思える方向へ行けるといいと思っています。ただ、どの科に進むにしても、ディープラーニングを使った解析は必要になると考えています。
松本卓也(まつもと・たくや)
東京大学医学部医学科6年。鉄門ゴルフ部、鉄門倶楽部(生徒会)などに所属。趣味は映画、旅行、水泳。東京大学医学部附属病院循環器内科にて女性ホルモン、深層学習に関する臨床研究に従事している。日本循環器学会関東甲信越地方会第251回Student Award 最優秀賞、第254回Clinical Research Award 優秀賞受賞。ACP日本支部年次総会・講演会2019黒川賞最終候補。来年度より虎の門病院内科プログラムにて研修予定。
長倉克枝 m3.com編集部