検索
特集/連載

医療機関が新型コロナ予測モデルを開発 感染者データ不足にどう対処したかCleveland ClinicのCOVID-19戦略【第2回】

Cleveland Clinicは、新型コロナウイルス感染症の問題に対処すべくデータモデルの開発に着手したが、感染者数のデータが足りないという問題に直面した。どのように解決したのか。

Share
Tweet
LINE
Hatena

 新型コロナウイルス感染症(COVID-19)のパンデミック(世界的大流行)が始まり、米国オハイオ州でも複数の感染者が発生した2020年3月16日の週、学術医療センターCleveland Clinicは患者の急増に備えるため、感染者数を予測するデータモデルの開発に着手した。

 取り組みを進める中で、Cleveland Clinicはデータ不足の問題に直面した。当時はCOVID-19の検査件数が非常に少なかったため、クリーブランド地域の感染者数を正確に把握することができなかったのだ。

図
図 SASとCleveland Clinicが開発したデータモデルの表示例。COVID-19に関連する分析シナリオに応じた、病院の1日の潜在的な稼働率を表している《クリックで拡大》

「データ不足問題」をどう乗り越えたのか

 「データモデルを開発するに当たり、分かっていることがあまりにも少なかった」。Cleveland Clinicでエンタープライズアナリティクス担当エグゼクティブディレクターを務めるクリス・ドノバン氏は、データ不足の問題についてこうに説明する。同施設が明確に把握していたデータは、自らが運営する病院の受け入れ患者数だった。そのため「そこから始めることにした」とドノバン氏は語る。

 Cleveland Clinicはまず利用可能な「SIRモデル」を調べた。SIRモデルとは、母集団を感受性保持者(Susceptible)、感染者(Infected)、免疫保持者(Recovered)の3つに分類して感染症の短期的な流行過程を予測する数理モデルだ。同組織はペンシルベニア大学(University of Pennsylvania)が開発したデータモデルも参考にした。これは他の医療機関も各自のデータを適用することで利用できるオープンソースのデータモデルだった。

 ペンシルベニア大学が公開するオープンソースのデータモデルのコードを参考に、Cleveland Clinicのデータサイエンティストは独自データモデルの開発を始めた。2020年3月21日と22日の週末をまるまる返上して作業を進めたという。

 翌月曜日の2020年3月23日までに、Cleveland ClinicはSAS Institute(以下、SAS)に連絡して独自データモデルの共同開発を開始した。その数日後には、オハイオ州北東部におけるCOVID-19感染拡大の影響に備えるための独自データモデルを経営陣に示すことができた。

 この点を振り返り、SASでグローバルパブリックセクターおよび財務サービス担当ディレクターを務めるスティーブ・ベネット氏は「サイエンスの専門家と医療の専門家という2つのグループが知識を出し合って、データモデルの内容と最適な運用方法を考えることで、このような共同作業の真価が生まれた」と話す。

 SASはデータモデルのコーディング支援だけをしたわけではない。同社は世界中の医療機関と仕事をしているため、米国より先にCOVID-19の感染が拡大した国や地域のデータも提供することが可能だった。Cleveland Clinicはそうしたデータを自らのデータと組み合わせて、予測モデルの質を高めることができた。


 次回は、Cleveland Clinicが分析結果に基づいて下した意思決定の内容を紹介する。

TechTarget発 先取りITトレンド

米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る