Cleveland Clinicは、新型コロナウイルス感染症の問題に対処すべくデータモデルの開発に着手したが、感染者数のデータが足りないという問題に直面した。どのように解決したのか。
新型コロナウイルス感染症(COVID-19)のパンデミック(世界的大流行)が始まり、米国オハイオ州でも複数の感染者が発生した2020年3月16日の週、学術医療センターCleveland Clinicは患者の急増に備えるため、感染者数を予測するデータモデルの開発に着手した。
取り組みを進める中で、Cleveland Clinicはデータ不足の問題に直面した。当時はCOVID-19の検査件数が非常に少なかったため、クリーブランド地域の感染者数を正確に把握することができなかったのだ。
「データモデルを開発するに当たり、分かっていることがあまりにも少なかった」。Cleveland Clinicでエンタープライズアナリティクス担当エグゼクティブディレクターを務めるクリス・ドノバン氏は、データ不足の問題についてこうに説明する。同施設が明確に把握していたデータは、自らが運営する病院の受け入れ患者数だった。そのため「そこから始めることにした」とドノバン氏は語る。
Cleveland Clinicはまず利用可能な「SIRモデル」を調べた。SIRモデルとは、母集団を感受性保持者(Susceptible)、感染者(Infected)、免疫保持者(Recovered)の3つに分類して感染症の短期的な流行過程を予測する数理モデルだ。同組織はペンシルベニア大学(University of Pennsylvania)が開発したデータモデルも参考にした。これは他の医療機関も各自のデータを適用することで利用できるオープンソースのデータモデルだった。
ペンシルベニア大学が公開するオープンソースのデータモデルのコードを参考に、Cleveland Clinicのデータサイエンティストは独自データモデルの開発を始めた。2020年3月21日と22日の週末をまるまる返上して作業を進めたという。
翌月曜日の2020年3月23日までに、Cleveland ClinicはSAS Institute(以下、SAS)に連絡して独自データモデルの共同開発を開始した。その数日後には、オハイオ州北東部におけるCOVID-19感染拡大の影響に備えるための独自データモデルを経営陣に示すことができた。
この点を振り返り、SASでグローバルパブリックセクターおよび財務サービス担当ディレクターを務めるスティーブ・ベネット氏は「サイエンスの専門家と医療の専門家という2つのグループが知識を出し合って、データモデルの内容と最適な運用方法を考えることで、このような共同作業の真価が生まれた」と話す。
SASはデータモデルのコーディング支援だけをしたわけではない。同社は世界中の医療機関と仕事をしているため、米国より先にCOVID-19の感染が拡大した国や地域のデータも提供することが可能だった。Cleveland Clinicはそうしたデータを自らのデータと組み合わせて、予測モデルの質を高めることができた。
次回は、Cleveland Clinicが分析結果に基づいて下した意思決定の内容を紹介する。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
ハロウィーンの口コミ数はエイプリルフールやバレンタインを超える マーケ視点で押さえておくべきことは?
ホットリンクは、SNSの投稿データから、ハロウィーンに関する口コミを調査した。
なぜ料理の失敗写真がパッケージに? クノールが展開する「ジレニアル世代」向けキャンペーンの真意
調味料ブランドのKnorr(クノール)は季節限定のホリデーマーケティングキャンペーン「#E...
業界トップランナーが語る「イベントDX」 リアルもオンラインも、もっと変われる
コロナ禍を経て、イベントの在り方は大きく変わった。データを駆使してイベントの体験価...