複数のデータの関連性を示すグラフ構造を持つ「グラフデータベース」は、新型コロナウイルス感染症の研究に役立つ可能性がある。ドイツの医療機関における事例を紹介する。
世界中の研究者が新型コロナウイルス感染症(COVID-19)対策の発見に向けて研究を進めている。研究者のさまざまな挑戦の中には、異なるデータの関連性を基に洞察を引き出そうとする取り組みがある。データの関係性を表す「グラフ」を使うデータサイエンスの手法(以下、グラフデータサイエンス)はこの研究で重要な役割を果たしており、研究者はさまざまな研究に関する情報やCOVID-19関連のデータをグラフ化できる。そこで活用されているのが、グラフ構造を持つデータベースである「グラフデータベース」だ。
Neo4jは、同社の同名グラフデータベース管理システムを使用するプロジェクト「Graph4Good」を立ち上げ、COVID-19に関する研究者を支援している。Neo4jは核となるグラフデータベースにグラフデータサイエンスのライブラリやデータ可視化ツール「Neo4j Bloom」、プレミアムサポートなどを組み合わせたツールだ。
グラフデータサイエンスはNeo4jにとっての最も重要なレイヤーであり、機械学習アルゴリズムとデータサイエンスのアプローチを組み合わせて、データの関係性を予測・分析する。グラフデータサイエンスの機能は、ドイツ糖尿病研究センター(DZD:Deutsches Zentrum fuer Diabetesforschung)のデータ・ナレッジ管理責任者であるアレクサンダー・ジャラシュ氏にとって特に興味深いものだった。
DZDは糖尿病を中心としたさまざまな疾患を研究している。「糖尿病患者は、新型コロナウイルス(SARS-CoV-2)の感染とCOVID-19による死亡のリスクが高い」とジャラシュ氏は述べる。DZDはNeo4jのグラフデータサイエンスライブラリをまず糖尿病研究に用い、現在はCOVID-19の研究にも活用している。
ジャラシュ氏によると、DZDがNeo4jを活用する最も重要な理由は、ある時点で複数のSARS-CoV-2感染が互いに関連し始めるためだ。ただし感染の追跡に必要な全てのデータがつながっているわけではない。同氏はドイツおよび世界中の科学研究データのほとんどが孤立している状況を指摘する。
DZDはNeo4jを使用して、それまで関連付けられていなかった複数のデータソースの関連付けに挑んでいる。ジャラシュ氏によると、SARS-CoV-2に関しては4万以上の出版物のデータセットがある。同氏は、研究者がこれまで見つけられなかった、データセット間の新しい関連性を発見できることを期待している。その際にはあらゆる種類のデータサイエンスと同様に、データ品質が重要な課題となる。
Neo4jのデータサイエンスのリードプロダクトマネジャーであるアリシア・フレーム氏によると、Neo4jのグラフデータサイエンスライブラリは、Neo4jのグラフデータベースに既に格納されているデータを使用して洞察を導き出す。「Neo4jに保存したデータを使用できる、機械学習ツールのようなものだ」とフレーム氏は説明する。
フレーム氏は「COVID-19との闘いにグラフデータサイエンスライブラリを役立てることができる、重要な領域が見つかっている」と語る。そのうちの一つは、連絡先の追跡と感染者の全ての接点を特定することだ。
米国ニューヨーク市のように人口密度の高い場所で、濃厚接触者の接点を追跡するのは難しい。こうした場所は、ほとんどの人が非常に多くの人々と接点を持っているためだ。「ニューヨークの医療機関にとって、人員や医療リソースの割り当てと予測は特に重要なニーズであり、グラフデータサイエンスが役立つ」とフレーム氏は話す。
特定の医療機関が過負荷状態になる可能性が高い時期を判断し、適切な代替施設を推薦するために、複数のデータの類似性を検出するアルゴリズムが役立つという。フレーム氏によると、こうしたアルゴリズムを使用することで「この医療機関は過負荷状態になっている可能性が高いので、代わりにこの医療機関を推薦します」といった助言を提供できるようになる。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
遠隔医療体制を構築する際は、患者や通常業務への影響を押さえながら進める必要がある。パンデミック下で一斉に遠隔医療体制を構築した2つの医療機関の例を紹介する。
オーストラリアでは処方箋の完全電子化が一般化しているが、制度確立までの道のりは平たんではなかった。完全電子化を阻んだ課題とその解決策とは。
コロナ禍を契機に、湾岸諸国では「デジタルヘルスケア」への移行が加速している。湾岸諸国におけるデジタルヘルスケア産業の重点投資分野とは。デジタルヘルスケア推進の”壁”とその対処法についても紹介する。
医療機関は膨大なデータを扱い、そのデータに基づいて重要な決定を下す場合がある。一方、データの質は低くなりがちだ。それはなぜか。データの品質を改善させるために必要な方策と併せて紹介する。
英国の国民保健サービスでイングランド地域を管轄するNHS Englandが、医療サービス向けの新データ基盤を構築している。この計画に英国市民団体が“待った”をかけたという。なぜなのか。
「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ
ネットワークの問題は「帯域幅を増やせば解決する」と考えてはいないだろうか。こうした誤解をしているIT担当者は珍しくない。ネットワークを快適に利用するために、持つべき視点とは。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...