東京⼤学未来ビジョン研究センター(旧・東京⼤学政策ビジョン研究センター)、慶應義塾大学メディカルAIセンター、エムスリー株式会社m3.com編集部が2019年1月から開催している「医療×AIセミナーシリーズ」のイベントレポートです。
東京大学未来ビジョン研究センター、慶應義塾大学メディカルAIセンター、エムスリー株式会社m3.com編集部が2019年7月21日に開催した医療×AIセミナーシリーズ第7回「臨床現場を効率化するAI・IT活用」に、京都大学医学部附属病院医療情報企画部教授の黒田知宏氏が登壇し、「AI管理に資する診療情報管理」と題して、京大病院が医療のデータを活用するためにこれまで進めてきた取り組みなどについて話した。
京大病院では1970年から電子カルテ作りの取り組みを開始。情報工学科ができた年で、かなり早い時期から手作りの医事会計システムがあった。黒田氏は2001年に京大病院に着任し、2003年から電子カルテ導入のプロジェクトに着手、2005年に実際に導入したという。こうした京大病院の電子カルテの歴史は、日本全体の傾向と一致する部分が多い。流れとしては1970年代から医事会計システムが広まり始め、1980年代には部門システムが導入されるようになり、1990年代にはオーダーエントリーシステムが登場し、2000年代に入ってから電子カルテが普及していった。こうした現状の中で現在、臨床判断支援システム(CDSS)や医療安全、AI(人工知能)について議論されるようになっていると捉えることができるという。
2000年までは効率化のためにこうしたシステムを作ってきたのが、ここに来て急にデータを使いたいと言われている状況で、電子カルテを構築してきた側としてはそもそもそんな目的でデータを集めていないため、すぐに役に立つデータになっていないのが現状だと黒田氏はいう。医事会計システムは国が定めたルールに則っているもので、部門システムは機械由来の形でデータが生み出されていて、オーダーエントリーシステムになって患者の状態などについて2~3行の文章が出てくるようになった。つまりは機械の立場からすると、ルールベースで構造がある古いデータほど使いやすいということになる。実際、包括医療費支払い制度(DPC)集められたデータなど、政策立案に利用されるものの多くは医事会計データを活用している。個別の病気のデータ分析になれば少しはカルテの情報を活用することもあるが、カルテのデータはほとんど分析対象になっていないのが実際だという。
なぜ電子カルテのデータは活用されていないのか。黒田氏は、コンピューターが扱いやすいのは機械可読のデータであるのに対して、カルテは本来人間が書いて人間が受け取るもののため、AIなどの機械にとって「美味しい」わけがない、と指摘する。今までの研究用医療データは、人間が紙に書いたカルテを研究したい人がエクセルに入力して作ってきた。電子カルテが登場して、単に入力する場所が病院側に、入力ツールがテンプレートに変わっただけだ。
京大病院では2005年にテンプレートを使い始めた。当初は電子カルテの導入そのものに対する反発があったものの、エクセルに記入したものを電子カルテに直接貼り付けられるようになれば、カルテとエクセルを同時に書く手間(二重入力の手間)がなくなるのであれば、電子カルテを使っても良い、という声もあったという。そんな意見を反映して作ったのがテンプレートデータベースだった。研究に必要でも、カルテに書く必要が無いデータがあることも考慮して、テンプレートに記入されたデータの一部をカルテに、残りは研究用の別のデータベースに保存して、両方をまとめて検索できる仕組みである。2010年ごろには、このデータベースに1日当たり1万3000件のデータが入力され、1カ月で430回くらい検索が実施されていたので、よく活用されていると言えるのではないか、と黒田氏は見ている。
一旦仕組みが作られると、医師たちもそれを使いこなし、新たな使い方も散見されるという。京都大学では、テンプレートを活用してバイオバンクが構築された。がんの治療のプロセスごとに患者のゲノムサンプルと診療情報を収集した、かなり質の高いデータベースも作られ、データを使って企業と共同研究するベンチャー企業KBBMも設立された。この一連の動きのきっかけになったのは、2003年にある医師が放った「二重入力がめんどくさい」という一言だったのだと、黒田氏は改めて振り返った。
テンプレートには、研究に使える構造化されたデータが集められるという利点があるが、記入に手間がかかるという問題点がある。テンプレートはデータを使いたい人の視点で作られているため、入力する側の思考の流れを壊してしまいがちである。京都大学のバイオバンクのテンプレートも大きく2回作り変えられた。最初は詳細なデータを取るために細かくしすぎたために診療現場に受け入れられず、次は用語の標準化がされていないためにデータがバラバラになるという事態になった。プルダウン型等の選択式入力が導入されて、やっと使えるものになったという。
こうした過程を経て、入力する人とデータ使う人で思考プロセスが異なるために質の良いデータをテンプレートで集めるのは相当困難であることに気付いたと黒田氏は言う。
2011年の電子カルテの更新のために2010年に調査を実施したところ、1000人の医師と1000人の看護師がいる京大病院で、パソコンを約3000台設置してほしいと言う要望が出てきた。なぜこの要望があるのか詳しく見てみると、看護師は勤務時間の7割ほどはパソコンに向かってカルテの入力をしている状況が浮かび上がってきた。業務の効率化の道具のはずだった電子カルテシステムが、看護師の時間を奪い取っているという事実を目にして、何のためにカルテはあるのか、人が入力しない良い方法はないのか、と考えるようになったそうだ。
1990年代初めからあるIoT(Internet of Things)という考え方を提唱したケビン・アシュトンも、人間は入力チャネルとしては性能が悪いこと、低速で低周波、さらには不確実なメディアを排除しないとコンピューターは仕事ができない、と指摘している。そこで、直接機械やデバイスから情報を収集する仕掛けを作ることで、「AIに資する」データを集められないか、京大病院で取り組むことにしたという。
病院で欲しいデータは計測値と計測した状況だが、状況の情報収集が難しい。だがそれも整理すると、どんなデータを収集すればいいのか見えてくる。5W1Hのうち、whyを除く4W1Hの情報が必要になるが、電子体温計など使うデバイスが決まるとhowとwhatが決まる。コンピューターの時計でwhenも決まるので、残るのはwhoとwhereになる。病院という環境に限って考えると、この二つはベッドの横に誰がいたのかが分かれば明らかになる。京大病院では全てのベッドの横に電波灯台を立てた。発信バッジをつけた看護師が近づくと、誰が来たのかわかる仕組みだ。最後に、デバイスを電波灯台に装置をかざすとデバイスが測ったデータが収集され、看護師が確認ボタンを押すと入力が完了する。ほとんどタイムラグなしにデータを集めることができるようになった。
こういうことができるようになると、もっと分析してみようということになるという。例えばいつもある病棟で特定の看護師だけが長時間ベッドサイドでやたら業務をしているというような「異常な」データに注目して、現場の状況を調査すると、その病棟における人間関係が良くないということも見出すことができ、医療事故の温床になるので、配置転換を検討しようというようなことが言えるようになる。
さらに現在は医療機器のメンテナンス記録と現在の設置場所を収集できる「医療機器の電子カルテ」を作ることも進めているという。ベッドサイドに運び込まれた機器が未整備の場合に警告を出せることになる。さらに、外からデータを書き込める装置も増えているので、患者のカルテの指示と計測された血糖値から薬の滴下速度を決定し、患者のベッドサイドにいる看護師の携帯端末等に情報を出して確認を求め、手術する腕を避けて注射をするようにとメッセージを送ったりできるようになる。こうして、「ここだけ今だけあなただけ」のさりげない情報支援を行うことで、人と機械が連携する「人間機械系システム」が構築できるという。
この人間機械系システムが集まると「サイバーフィジカルシステム」ができる。全体が協調してさりげない情報サービスの提供が可能になる。使う人は、機械が良いサービスを自分に与えてくれるよう、正確なデータを与えるようになり、「一次フィードバック・インセンティブ」がうまく機能するようになる。現在京大病院では実験を進めているところで、次の電子カルテの更新までにこうしたシステムを導入するかを判断する予定だという。
こうしてデータが入手できると、分析したくなるものだ。分析に広く用いられるデータ・ウェアハウス(DWH)の良さはデータを紡ぎ直せることだという。例えば糖尿病患者の薬を変えたタイミングを調べて、新しいDPP-4阻害薬が出た2010年前後でどう投薬行動が変化したかということも分析できる。切り替えがうまくいった症例とそうでもない症例など、データを紡ぎ直すことで今まで見えなかった事実が見えてくることもある。
一方で、データの紡ぎ直しが必要なことがDWHの泣き所でもあると黒田氏はいう。DWHは、予め整理した通りにしか分析ができないため、新しいことを始めるためには紡ぎ直しが必要である。紡ぎ直しにはコストがかかるため、何かを試しに分析するということには向いていない。そこで、とりあえずデータを投げ込んでおき、カタログを作っておいて何が入っているかを分かるようにしておくデータレイクというIBMが提唱している考え方を導入する予定だという。データレイクがある世界では、丁度湖からの水系に浄水場を設置するように、何かを分析したいときに小さなデータセットを作ればいい。
このアプローチへの切り替えは、ナショナル・データベース(NDB)を広く使ってもらえるようにするプロジェクトがきっかけになっている。レセプトは分析に向いていない構造で保管されていて、ユーザーそれぞれが紡ぎ直してデータベースを作る前提で運営されているため、みんなが使いやすい構造になっていないのだという。黒田氏は次世代のNDBをデータレイク方式にすることを厚労省に提言していて、今年8月23日に都内で開催されるNDBユーザー会でもこうした議論を行う予定だという。
AI開発においては、AIの教師データセット作成に取り組む人が脚光を浴びがちだが、分析可能なデータを作り出しているのは、データソースとなる患者、データを電子カルテに入力する医療者、電子カルテシステムを支える人などだ。こうした仕組みを分かっていない人がAI用データ収集システムを作ると悲惨なことになる、と黒田氏は厳しく指摘する。医療情報学会では、AMEDからの委託を受けて、黒田氏らを中心に、データの抽出・キュレーション・匿名化など、電子カルテや医療データを取り巻くルールを満たしたデータ収集システム実現のためのガイドラインを定めている。
また、患者側への配慮も重要だと黒田氏は強調する。以前、病院のデータが企業の金儲けに使われるのではないかと疑った患者の批判を受けた京大病院では、2年もかけて医療情報の提供方針を作成したという。外部機関が京大病院のデータを学術研究に活用する時には、分析経費1回500万円を支払い、データそのものでは無く分析結果を受け取れるルールを整備した。得られた収入を経費に充てた後の余剰分は専用の基金を通じて患者のアメニティに使い、その使途は公開する予定だという。
個人情報保護法の下ではデータのコントロール権は患者側にあるので、データサイエンスにデータを使わせて貰うためには、社会的受容を得ながら物事を進めることが極めて重要だという。医療データ活用先進国であるフィンランドのキーマンは、Trust is the key for success, nothing to hide is key for trust(成功の鍵は信頼で、その信頼を得るためには隠し事をしないことが鍵だ)といい、もう一つの医療データ活用先進国エストニアのキーマンも、データを活用した患者向けのサービスを先に始めることが重要で、データの二次利用を優先することは失敗の要因になるといっている。その点日本は、絶対安全で何も問題は起きないから、医学のためにデータを提供してください、というメッセージを発信するという、まるで正反対のことをしていると黒田氏は厳しく批判した。
社会的受容を醸成するためには、技術を理解していてマネジメントもできる医療データ人材、つまりはアクセルとブレーキを知っている人が今後欠かせないと黒田氏はいう。今後、京大と東京大学が文部科学省の予算を受けてこうした人材育成に取り組むことになっている。京大では修士課程の学生向けのプログラムと企業向けの短期間のプログラムを準備している。いずれ、大学病院はAIを育てる場へと変化し、AIを育てるプロセスを体験することで、人も学べる場になるだろうとのことだ。つまり、大学は医療データを実際に触って学べるサンドボックスへと変化することになるのだそうだ。
鴻知佳子 ライター
大学で人類学、大学院で脳科学を学んだ後、新聞社に就職。バイオを中心とする科学技術の関連分野を主に取材する。約10年の勤務後に退社。ずっと興味があった現代アートについて留学して学び、現在はアートと科学技術の両方を堪能する方法を模索中。