東京⼤学未来ビジョン研究センター(旧・東京⼤学政策ビジョン研究センター)、慶應義塾大学メディカルAIセンター、エムスリー株式会社m3.com編集部が2019年1月から開催している「医療×AIセミナーシリーズ」のイベントレポートです。
東京大学未来ビジョン研究センター、慶應義塾大学メディカルAIセンター、エムスリー株式会社m3.com編集部が2019年6月15日に開催した医療×AIセミナーシリーズ第6回シンポジム「医療AIの臨床への実装とトラスト」では、「臨床へのAI実装には何が必要か?」をテーマにパネルディスカッションで専門から8人による意見交換が行われた。同シンポジウム内で個別の講演をした6人に加え、東京大学未来ビジョン研究センター特任講師の江間有沙氏、世界経済フォーラム第四次産業革命日本センターのヘルスケア・データ政策プロジェクト長の藤田卓仙氏が加わり、これまでの講演で見えてきた課題について話し合われた。前後編に分けて主な議論を紹介する。
まず最初に、医療AIの学習に使うためのデータの収集や作成をよりスムーズにするにはどうしたら良いかという課題が提示され、ディスカッション参加者がそれぞれ意見を話した。 株式会社MICIN代表取締役CEOの原聖吾氏は、医療に関してはデータ化されていないものがあまりに多いというのが大きな課題だとした。しかもデータ化されてるものは、例えば電子カルテは記録のため、レセプトは支払いのためというように、健康医療や予防、診療のためのデータが作られていない状況で、目的に合わせたデータ化が必要だとした。
慶應義塾大学医学部専任講師の岸本泰士郎氏は、精神科でAI開発を進めている立場から、紐付けデータが非常に不足しているという実感を話した。精神科は診断基準はあるが、専門医同士でも診断が一致しないこともあり、ゴールド・スタンダードというべきものや「正しい答え」が果たして何なのか、正しいバイオマーカーが何なのか情報が不足している領域で、模索しながらデータ蓄積を進めているという。時間はかかるが価値があることで、こうした取り組みを理解して支援してくれるファンドや協力者が必要だとした。
ただともひろ胃腸肛門科院長で、AIメディカルサービス代表取締役会長・CEOの多田智裕氏は、データ収集でどのような工夫をしているか、自身のチームの場合について紹介した。消化器の内視鏡AIは内視鏡で撮った画像、内視鏡のレポート、そして病理データの3つのデータが揃うことで研究開発が可能になる。病理データはもともと記述される情報が決まっているため集めやすく、内視鏡のレポートも日本消化器内視鏡学会が進めているJEDプロジェクトによって用語が統一されたため、データとして集めやすくなっているという。加えて、多田氏のチームでは画像の匿名化、動画の匿名化、アノテーションツールなど自前のデータ収集のツールも作っていて、臨床研究自体が日本医師会の倫理審査委員会に内視鏡AI研究という広いテーマで承認を受けているため、追加データ収集も追加申請でオプトアウトの手続きで進められるようになっているという。
京都第二赤十字病院の内科科部長/院長補佐の田中聖人氏は、やはりデータの構造化が課題だと強調した。患者の背景情報の構造化と、その情報を他の診断情報などとクロスリンクして活用できる環境を整備する必要があるという。JEDのプロジェクトでは喫煙や飲酒、家族歴、その他の生活習慣などの患者の背景情報も収集しているが、AI用と電子カルテ用と内視鏡医は二重入力を余儀なくされている状況だという。問診の構造化と標準化を進めないと、大量のデータの中から意味のある情報を取り出せる真の意味でのビッグデータにはならないと指摘した。既往歴や家族歴のバリエーションはそんなにないため、問診の基本フォーマットがあればあとは各診療科でそれぞれが必要な情報だけを追加するだけで済むようになるという。田中氏は中国の早期がんの研究の例を紹介し、患者の住まいの水や地質のマグネシウム、食事、お茶や飲酒の状況までデータを収集していてビッグデータを構築している点を見習う必要があるとした。
日本医師会常任理事の羽鳥裕氏も、電子カルテの構造化の問題を挙げた。レセプトデータを電子請求に切り替えた時に厚生労働省は電子カルテも構造を統一すべきだったのではないか、とした。現状、電子カルテは各メーカーがそれぞれ開発している。既往症や家族歴などの本当に重要な基本的なデータこそ入力すべきで、さらに問診も統一すれば必要な基本的なデータの大半が集められるようになるとした。羽鳥氏は、日医標準レセプトソフトウェアORCAと連携する電子カルテはデータの標準化に役立つかもしれないと期待する一方で、新しいシステムが登場するとこれまでのデータが使えなくなってしまう可能性もあると指摘した。
厚生労働省大臣官房厚生科学課医療イノベーション企画官の江浪武志氏は事務局を担当する「頬兼医療分野AI開発加速コンソーシアム」でのこれまでの議論を振り返り、質の担保されたデータをAIの開発に向く形で集めることが議論の中心だったとした。日本医療研究開発機構(AMED)のプロジェクトように、学会を中心として質の担保されたデータを集めるというのは日本独自のやり方で、世界に誇れる方法だという。一方で国が整備するビッグデータもありうるため、住み分けながらきちんとデータ収集をしていくことが非常に大事だと強調した。
また、AIに向く形のデータ、アノテーションにかかる労力の省力化についての意見も多くあったという。各学会の中で自動でアノテーションをつけるツールの開発などが進められており、いかにデータを作るところの負担を軽減できるかも重要だとした。
江間氏は、診療科ごとによってデータ収集の面での課題が違う点を指摘し、そもそも何が標準データなのかというところから考える必要があるとした。社会からはざっくりと医療AIと一括りにされてしまうが、中身に違いがあることを政策を作る側、利用者、メディアなどがきちんと理解すべきで、そのための場も必要だと感じたという。
また、患者が自身の基本的なデータを持つポータビリティーも課題として挙げた。どうやって患者側が自身のデータを管理し、医療従事者にどう渡すかということも医療AIには広い意味では関わってくるとみているという。医療AIの関係者とは誰を指すのか、データから考えることも大事な論点だとした。
藤田氏は、データの構造化には2つの方向性があるとした。1つは構造化されていない山のようなデータを使えるようにするという方向で、しかしそれでは品質が担保できないのでやはりAIのために構造化されたデータを取れるようにしようというもう1つの方向だ。そして実際に各学会が協力しながらアノテーションをし、狭くて深いいいデータベースの構築も進んでいるという。ビッグデータということで、匿名加工した情報を組み合わせて新しい発見ができないかというところも出てきている。病院の中だけではなく日常生活の中の情報も集められるが、集めるだけではなく、患者を中心とするデータとつないでその後の経過を追っていくことも必要になると指摘した。いかにコストをかけずにデータを集めるかということも課題になるとした。
参加者全員から意見が出た後に、田中氏は様々なデータをリンクさせるために、フォーマットが重要である点を改めて強調した。また、課題が指摘されているレセプト情報・特定健診等情報データベース(NDB)も、東日本大震災後に患者のデータが喪失してしまった地域ではバックアップに活用することができたとして、有用に活用された事例を紹介した。
また、診療報酬請求の要件にすることで医師が実施しやすくなるため、診療報酬請求と紐づけてあらかじめ問診の重要項目を設定するなど、インセンティブを作ることも有効かもしれないと提案した。他にもヘルスケアや健診と医療のデータが繋がっていない点を課題として挙げた。それぞれで問診があるが、患者側からすると同じことが繰り返し聞かれることが多いという。医療だけではなくヘルスケア、そして健診のどれでも使えるような緩やかな問診の標準化ができれば、高精度なデータが集められるのではないか、とした。
鴻知佳子 ライター
大学で人類学、大学院で脳科学を学んだ後、新聞社に就職。バイオを中心とする科学技術の関連分野を主に取材する。約10年の勤務後に退社。ずっと興味があった現代アートについて留学して学び、現在はアートと科学技術の両方を堪能する方法を模索中。