デューク大学ヘルスシステムの緊急診療科は、深層学習モデルのAIツールを導入することで、敗血症に起因する死亡件数を劇的に減少させた。ツールの成功は、技術的な取り組みはもとより、職場における力関係や政治的側面の調整をはじめとする現場での地道な活動の賜物と言える。
2018年11月、デューク大学ヘルスシステム救急診療科に、新たな深層学習ツールが導入された。 「セプシス・ウォッチ(Sepsis Watch)」は、世界における院内死の主要原因のひとつである敗血症の初期兆候を見つけるのを支援するための医療者向けツールだ。
敗血症は、感染が引き金となって全身に炎症が起こり、やがて臓器が機能停止に陥いる病気である。早期に診断されれば治療が可能だが、敗血症の初期症状は他の病気と区別がつきにくく、早期診断が難しいことで有名だ。
セプシス・ウォッチは、その状況を一変させるものとして期待されていた。カルテのデジタル化、3200万件に及ぶデータポイントの分析、iPadアプリの形式でのシンプルなインターフェイスの設計など3年半かけて開発されたこのツールは、1時間ごとに患者の状態を評価し、敗血症の発症リスクをスコア化する。中度から高度のリスクがあると判断された患者と、すでに判断基準を超えた患者が通知され、医師が診断し次第、即座に治療を開始できる。
ツールの導入から2年間に得られたデューク大学ヘルスシステムの病院経営陣と臨床医らの実体験に基づく証拠は、セプシス・ウォッチが実際に効果をもたらしていることを示している。敗血症に起因する死亡件数は劇的に減少し、セプシス・ウォッチは現在、連邦政府に認可された臨床試験の一部で使われている。この臨床試験の結果は、2021年に公開されることとなっている。
一見すると、これは技術が大勝利を収めた例に思える。入念な開発とテストを経た人工知能(AI)モデルが、医師の診断能力を増強させるのに成功したというわけだ。しかし、データ&ソサエティ研究所(Data & Society research institute )が発表した新たな論文によれば、それは話の半分に過ぎない。もう半分の要となったのは、プロジェクトを率いる臨床医がこのツールを日々のワークフローに融合させるために要した、大量かつ高度な社会的労働だ。この作業には、意思疎通のための新たな手順を設計して新たな訓練教材を作成することだけでなく、職場における力関係や政治的側面を調整することも含まれた。
この事例研究は、実世界でAIツールを有効活用するために本質的に求められるものが何かを忠実に反映している。上述の論文の共著者であり、AIの影響力を調査している文化人類学者のマデライン・クレア・エリッシュ博士は「それは本当に複雑なものでした」と語る。
インベーションは元来、混乱を引き起こすものだ。より良い結果を得るために古いやり方を揺り動かし、一新させる。だが、革新的技術が引き起こす混乱についての議論において、それが「破損」の一形態でもあるという認識が話題に上ることはほとんどない。従来の慣習は廃止され、社会的な序列がかき乱される。既存のシステムの中でイノベーションを機能させるには、エリッシュ博士と共著者のエリザベス・アン・ワトキンス博士が言うところの「修復」が必要だ。
デューク大学ヘルスシステムで2年間にわたって実施されたセプシス・ウォッチの調査では、こうした混乱と修復の例が数多く示された。中でも大きな課題の1つは、このツールが、医療界に深く根付いた医師と看護師との力関係に逆らう性質を持っていることだった。
設計の初期段階で、このツールの主要なユーザーは緊急対応チーム(RRT)の看護師たちとなることが明確になった。患者の病状を確認し、敗血症の診断を下すのは基本的に主治医の仕事だが、医師たちには従来の救急科の業務のほかに別のアプリをモニターし続ける時間はない。これに対し、RRTの看護師の主な仕事は、患者の健康状態を継続的にモニターし、必要に応じて付加的な治療支援をすることだ。セプシス・ウォッチのアプリをチェックする業務は、看護師のワークフローに自然になじんだ。
だが、ここで問題が生じる。 アプリがある患者にハイリスクのフラグを立てた場合、看護師はその患者を担当する救急主治医(医療用語でいうところの「EDアテンディング」)に連絡しなければならない。しかし、専門医と看護師は院内の全く異なる部門で働いていたため、こうした関係を持っていないことが多かった。そのうえ、この手順は一般的な病院の指揮系統を完全に逆転させることを意味した。「冗談でしょ、と思いました」ある看護師はアプリの運用方法を知った時の気持ちをそう振り返った。「私たちがEDアテンディングを呼びつけるなんて」。
しかし、それが最善の解決策なのは事実だった。そこで、プロジェクトチームは大小さまざまな方法で「混乱」の修復に取り組んだ。看護師長たちはセプシス・ウォッチへの期待と信頼を高めようと、仲間の看護師たちを招いて気楽なピザパーティを開いた。 さらに、主治医とのやり取りを円滑にするためのコミュニケーション戦術も考えた。例えば、複数のハイリスク患者について1回にまとめて話すことで通話の頻度を1日1回にとどめ、医師が最も忙しくない時間帯を狙って連絡することに決めた。
加えて、プロジェクトの主導者らは臨床現場のリーダーたちに対してセプシス・ウォッチの効果を定期報告するようになった。 プロジェクト・チームによる調査の結果、デューク大学ヘルスシステムの全てのスタッフが敗血症に起因する死を課題とみなしているわけではないことが判明した。病院全体の統計を俯瞰的に見ていない医師は特に、骨折や重度の精神疾患といった日々の緊急案件への対応で手一杯であり、結果としてセプシス・ウォッチを仕事の邪魔と考える人もいた。しかし、臨床現場のリーダーたちにとって敗血症の優先度は非常に高く、セプシス・ウォッチの威力を実感すればするほど、運用の円滑化に力を入れて取り組んだ。
エリッシュ博士は、セプシス・ウォッチが成功にこぎつけたのには主に2つの要因があるとみている。1つめは、このツールが非常に局所的なかつ具体的なコンテキストに適合するよう作られているという点だ。セプシス・ウォッチは他のどの組織でもなく、デューク大学ヘルスシステムの救急科のために開発された。「このオーダーメイド式の開発が、成功の鍵でした」とエリッシュ博士は言う。これは典型的なAIの常識に反することだ。
2つ目の要因は、全開発過程を通じて、開発チームが定期的に看護師や医師、その他のスタッフを含む、病院組織のあらゆる階層の人員からフィードバックを募ったことだ。これによってツールの使いやすさが向上しただけでなく、プロジェクト成功のために熱心に協力してくれるスタッフたちの小さなグループも生まれた。また、ソフトウェア企業から突然やって来た技術者ではなく、デューク大学ヘルスシステムの臨床医自身が開発プロジェクトを主導したことも重要だったとエリッシュ博士は言う。「アルゴリズムの中身を説明できないのであれば、他の方法で信頼を築く必要があります」。
こうした教訓は、機械学習の医療への応用を研究するマサチューセッツ工科大学(MIT)次期助教授のマーゼ・ガゼミにとって馴染み深いものだ。「人間による評価や利用を意図した機械学習システムはすべて、社会技術的な制約を念頭に置いたものでなければなりません」とガゼミは語る。特に、人間の意思決定に基づいて運営され、最も脆弱な状態にある人間のケアを伴う医療現場では、「人間に関するロジスティクス上の制約に留意しておかなければなりません」とガゼミは付け加える。
エリッシュ博士は、自身の手掛けたセプシス・ウォッチの事例研究が、研究者らが医療用AIの研究開発全般に対するアプローチを見直すきっかけになることを望んでいる。「AI が理論上、どのようなものに成り得て、何を実現しうるか」ついては数多くの研究が進行中だが、その一方で「実際の導入現場でどういったことが起こっているかという情報があまりに少なすぎます」とエリッシュ博士は言う。だがAIが期待通りの威力を発揮するには、それを社会に組み入れる方法についても技術開発と同じくらいよく考えなければならないのだ。
エリッシュ博士の研究は、ある重大な問いを投げかけてもいる。「責任あるAIとは、その場所ごとの特異なコンテキストに対して注意を払うものでなければなりません。私は文献研究や訓練を通じて、ある場所で何かを開発してそれを別の場所に使いまわすことはできないという教訓を得ました」とエリッシュ博士は言う。
「つまり本当の課題は、運用場所ごとの特異性を維持しながら規模を広げていくにはどうしたらいいかを考えることなのです」とエリッシュ博士は言い添えた。これが、AI研究の次なる最前線だ。
転載元の記事はこちら
MIT Technology Review