新型コロナウイルスのワクチンが完成していない現在、経済活動の再開には、大規模な検査を高頻度で実施するしかない。カリフォルニア大学バークレー校のデータ科学者らは、機械学習とプーリング検査を組み合わせることで、コーヒー1杯分のコストで検査を実施できると提言する。
安全で効果的なワクチンが幅広く利用できるようになるまでは、新型コロナウイルス(SARS-CoV-2)の感染をくい止めることが最も重要となる。そのためには、誰が新型コロナウイルスに感染しているのかを知る必要がある。最近になり、検査能力は向上しているが、感染者の半数近く近くを占める無症状患者の検査に必要なレベルには程遠い。
私たちの研究によると、データサイエンスを活用することで、現在の検査能力を効果的に向上させられることが分かった。機械学習とプーリング検査(複数の人の検体を混ぜ合わせて一度に検査すること)を組み合わせれば、大規模な人口集団が毎週または毎日でも、1日1人当たり3ドルから5ドル程度で検査を受けられる。
つまり、検査ごとにかかる費用はコーヒー1杯分ほどだ。それだけの費用で政府は、新しい研究所を建築したり、新しい薬やワクチンを作ったりしなくても、安全に経済活動を再開させて、今も続いている新型コロナウイルスの感染を止めることが可能となる。
新型コロナウイルスの検査を受けている人々のほとんどは、症状があるか、感染者の濃厚接触者だ。しかし、会社や学校の再開を迫る声が高まる中で、組織は不都合な真実に対処せざるを得なくなっている。それは、症状を頼りに検査をすると、無症状の症例や症状が出る前の症例を見逃すことになり、すべての人を危険に晒してしまうということだ。
しかし、現在の選択肢は魅力的ではない。頻繁ではない検査(多くの提案では毎月がデフォルトになっている)や闇雲なスクリーニングでは、感染者が発症するまでの数週間にウイルスを拡散してしまう。また、費用はいまだに100ドルから200ドル以上と高額だ。
機械学習アルゴリズムに基づいた「プーリング検査」によって、こうした状況を変えることができる。プーリング検査では、多くの人の検体を混ぜて1つにする。そこからウイルスが検出されなければ、検体を混ぜ合わせた集団(「プール」と呼ぶ)内の人は誰も感染していないことになる。たった1度の検査でプール全体の人々の検査結果が判明するのだ。
しかし、落とし穴もある。プール内の誰か1人でも感染していれば、検査結果は陽性反応を示し、誰がウイルスに感染しているのかを特定するためにさらに検査が必要となる。
そのため、プールにひとまとめにして検査をする人々を選ぶ際に、陽性になる可能性の高い人たちを特定し、そうでない人たちと分けることが重要となる。そこで登場するのが機械学習だ。
米国では感染のリスクが急速に高まっており、ニューヨーク州とフロリダ州の相対的なオッズ比(ある疾患へのかかりやすさの比率)は数週間のうちに逆転した。また、医療従事者であるか、リモートで働く従業員であるかによっても、リスクは大きく異なる。それぞれの個人のリスクを見積もるのは、機械学習に最適のタスクだ。
雇用主や学校から公表されているデータや、地域の感染率および検査率に関する疫学的データ、さらに、もし使えるようなら、移動パターンや社会的接触、下水といったより詳しいデータを利用すれば、新型コロナウイルス感染のリスクを毎日予測できるモデルを作成できるだろう。これにより、人々の検体を1つにまとめる際に非常に柔軟性のあるアプローチが可能になり、プーリング検査の効率を大幅に上げられる。
プーリング検査は、有病率が低いと、より効果的になる。ある集団、例えば、ある大学の学生全員を毎日検査すれば、その集団の全員の感染リスクが劇的に減少する。これは単に、今日の診断で陽性と判定された人を、明日の検査対象から外せるからだ。そうなると、翌日にはより多くの人を検査できるようになり、必要な検査数を減らせるので、その集団の検査費用を安くできる。さらに、より頻繁に検査することで、感染していても無症状の人に自宅待機してもらえるようになり、ウイルスの拡散が一層抑えられ、プーリング検査はさらに効果的になる。
結果として、機械学習を用いた高頻度のプーリング検査は、想像よりはるかに低コストとなる。私たちの分析では、毎日検査をしても、費用は月ごとの検査のわずか2倍だ。また、毎日検査をすると、ウイルスを積極的に抑え込むことができる。これに対し、月ごとに検査をしても、事態がどれほど悪化したかが分かるだけだ。
この効果は、精肉工場や老人ホームなどの状況下で非常に顕著となる。頻度を上げると、実際には、一定の期間内で必要な検査数を減らして集団検査の費用を下げられる。つまり、検査の頻度を上げると、医療システムのコストを下げることができる。
検査による予防の最後の柱として、人と人と間のウイルス拡散を考慮に入れること、つまり相関リスクを考慮に入れることが必要となる。機械学習を用いてソーシャル・ネットワークをモデル化することは、コンピューター科学や経済学などの分野でますます注目されている。こうしたアルゴリズムを職場、教室、大学の寮など多くの環境に関するデータと組み合わせることで、機械学習ツールはさまざまな人が交流する可能性を評価できる。この可能性が分かれば、集団検査はさらに効果を発揮する。
実世界でプーリング検査の頻度を上げることは可能なのだろうか? 私たちは実施上の課題を最小限にしたいわけではないが、それらは単に課題であって、呑み込めない条件ではない。米国食品医薬品局(FDA)は、プーリング検査の最初の使用を承認したばかりであるが、この手法が陽性者を検出するのに十分な感度があることはますます多くの研究で明らかになっている。研究室の準備が整えば、検査員はすぐにもプーリング検査を始められる。
現在のアウトブレイクの規模から、プーリング検査の実現可能性を疑問視する声もあるが、これは単なる挑戦である。なぜなら私たちは従来、大規模な集団におけるウイルス有病率の大雑把な推定値に依存しており、その推定値は、私たちの論文で示したように不正確である可能性があるからだ。これに対して機械学習は、陽性と判定される可能性のある人を特定し、大きなプールの中に入れないようにすることで、有病率が高い場合にもプーリング検査を機能させるために必要な正確な個人レベルの推定値を出すことができる。
ウイルスの有病率が高い場合にも、頻繁な検査は大きなメリットをもたらす。プーリング検査を実施する前に、工場や学校などでは、集団全体で1回のスクリーニング検査を完了できるかもしれない。スクリーニング検査で見つかった感染者が回復するまで自宅待機していれば、高頻度のプーリング検査によって病気を早期に発見し、有病率を下げられる。
さまざまな環境での検体収集やプーリング計画にも対処する必要がある。人々が検査サンプルを自分で収集して提出できる製品の中に、FDAに承認されたものもあるのは心強い。唾液を使うある製品は、大規模な検査でもコストを上げずに済むだろう。
今こそ、高頻度検査を新型コロナウイルス対策戦略の中核に据えて、経済活動を再開すべきだ。機械学習の力を利用したプーリング検査は、関連する費用を支払えるだけでなく、ロックダウンを延長するという代替案と比較して莫大なメリットがある。
◆◆◆
筆者のネッド・アウゲンブリック、ジョナサン・コルスタッド、シアド・オーベンメイヤーはカリフォルニア大学バークレー校の准教授であり、医療問題に機械学習を適用するコンサルティング会社であるバークレー・データ・ベンチャーズ(Berkeley Data Ventures)の共同創業者でもある。
転載元の記事はこちら
This article is provided by MIT TECHNOLOGY REVIEW Japan
Copyright ©2020, MIT TECHNOLOGY REVIEW Japan. All rights reserved.
MIT Technology Review