米国大学病院の医療用テキストマイニングツール活用事例、導入の苦労や成果は?電子カルテや医師のメモを自然言語処理で分析

ペンシルベニア大学系列の医療グループ「Penn Medicine」は、自然言語処理技術で非構造化データを利用して、分析の質や患者ケアの向上につなげた。導入から活用までのプロセスや課題を紹介する。

2018年04月03日 05時00分 公開
[Mary K. PrattTechTarget]
Penn Medicine ペンシルベニア大学系列の医療グループ「Penn Medicine」のWebサイト《クリックで拡大》

 ペンシルベニア大学系列の医療グループ「Penn Medicine」(注1)は、多くの組織が抱えているのと同じ問題に直面していた。それは、大量の貴重なデータが既存のコンピュータで分析できないことだった。データが自由記述など、構造化されていない方法で入力されていたからだ。

※注1:ペンシルベニア大学医学部と、ペンシルベニア大学ヘルスシステム(ペンシルベニア大学病院を中心に、複数の医療施設が加盟している医療ネットワーク)で構成されているグループ。

 「非構造化データを検索、分析するには膨大な時間がかかっていた」と、Penn Medicineのバイオバンク部門インフォマティクス担当ディレクターを務めるデビッド・バートウェル氏は語る。だが、研究プログラムで非構造化データが欠けてしまうと、研究者は、患者や病状、治療プロトコルをできるだけ完全に把握することができなかった。

 「深い研究をするには、こうしたリソースから情報を引き出すことが絶対に必要だった。Penn Medicineが研究の最前線に立ち続けるためにこうした情報を得る必要があるのは、火を見るよりも明らかだった」。バートウェル氏は、Penn Medicineが抱えていた膨大な非構造化データについて、そう振り返る。

 実際、Penn Medicineの幹部は何年も前から、そうした非構造化データに取り組む必要があることを認識していたと、バートウェル氏は語る。だが、数年前にようやく、自然言語処理(NLP:Natural Language Processing)技術が、期待した効果を実現するほど成熟したと考えるようになったという。NLPは、Penn Medicine幹部が、非構造化データへアクセスするための切り札と考えた人工知能(AI)の一種だ。

 「われわれは、われわれの大学の研究者が画期的な研究に取り組めるようにしたい。そのためには、彼らは数百万件のテキスト記録の非離散的な部分から、高品質の情報を引き出す必要がある。さらに、その作業を迅速かつ効率よく実行する必要があり、そのプロセスにおいてプライバシーを尊重しなければならない」(バートウェル氏)

 そこでPenn Medicineは、Linguamaticsのテキストマイニングプラットフォーム「I2E」ベースの医療機関向けNLPプラットフォーム「Linguamatics Health」を導入し、クエリの作成と、非構造化情報を含むさまざまなソースのデータを自動でテキストマイニングできるようにした。非構造化情報には例えば、電子医療記録(EHR)や専門診療科の報告書に記録してある医師のメモなどがある。こうした文書は多様な形式の非構造化データを含み、特に顕著なのが、自由記述テキストや、専門的な医療用語を含むテキスト(病理報告書など)、不連続データポイントと自由記述テキストの組み合わせを含む文書だった。

 バートウェル氏によると、Penn Medicineは市場を調査し、NLP技術を導入済みの医療機関から話を聞いた上で、Linguamaticsの技術を選定した。Linguamatics Healthの概念実証(PoC)として幾つかのプロジェクトを実施した後で、Penn Medicineは2015年に、同プラットフォームを広く導入したという。

データドリブン文化への入り口

 NLP技術では、テキストや音声内の言葉の処理に機械学習アルゴリズムを適用する。「この技術は、ビジネスインテリジェンス(BI)やアナリティクス製品の一部として提供されるようになった」と、451 Researchのデータプラットフォームおよびアナリティクス部門のシニアアナリスト、クリシュナ・ロイ氏は語る。

 「今ではほとんどの企業がデータドリブンであるか、あるいはそうなりつつあるところだ。データや指標に基づいてビジネスを運営したければ、組織内の人々がデータにアクセスでき、それを理解して分析できなければならない」(ロイ氏)

 BIプログラムはNLP技術を使用して、分析クエリでアクセス可能な情報の幅を広げるとともに、そうした情報を探して分析できる労働者のタイプも広げている。

会員登録(無料)が必要です

Copyright © ITmedia, Inc. All Rights Reserved.

隴�スー騾ケツ€郢晏ク厥。郢ァ�、郢晏現�ス郢晢スシ郢昜サ」�ス

事例 アステリア株式会社

ノーコードでアプリ開発とデータ連携を実現、9社の事例に学ぶ現場DXの推進術

工場や倉庫などの現場では、人手不足などにより業務負担の増大が懸念されており、業務のデジタル化と業務プロセスの改善が急務となっている。そこでモバイルアプリの作成からデータ連携までをノーコードで実現できる製品が注目されている。

製品資料 ジオテクノロジーズ株式会社

6つのユースケースから学ぶ、「人流データ」の効果的な活用方法

広告や小売、観光振興、まちづくりなど、さまざまな領域で導入が進む「人流データ」。その活用でどのような施策が可能になり、どのような効果が期待できるのか。人流データ活用の6つのユースケースを紹介する。

製品資料 ジオテクノロジーズ株式会社

基礎から解説:「人流データ」の特徴から活用におけるポイントまで

人の動きを可視化した「人流データ」。屋外広告の効果測定や出店計画、まちづくりや観光振興など幅広い領域で活用されている。その特徴を確認しながら、価値のある分析・活用につなげるためのポイントを解説する。

事例 アルテリックス・ジャパン合同会社

地図情報によるデータ分析作業を効率化、ゼンリングループ企業はどう実現した?

多くの企業でデータ活用が模索されているが、データ処理の煩雑さや属人化が課題となっている企業は少なくない。そこで注目したいのが、データ分析ツールの活用で課題を一掃した「ゼンリンマーケティングソリューションズ」の取り組みだ。

製品資料 サイオステクノロジー株式会社

ITインフラの自動化を実現、いま注目のクラウド型マネージドサービスの実力

複雑化を続けるITシステムの運用管理は、企業にとって大きな負担だ。そこで負担を軽減するものとして注目したいのが、クラウド上でさまざまな機能を利用できるマネージドサービスだ。本資料では、その詳細を解説する。

郢晏生ホヲ郢敖€郢晢スシ郢ァ�ウ郢晢スウ郢晢ソスホヲ郢晢ソスPR

From Informa TechTarget

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。

繧「繧ッ繧サ繧ケ繝ゥ繝ウ繧ュ繝ウ繧ー

2025/05/09 UPDATE

ITmedia マーケティング新着記事

news025.png

「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。

news014.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news046.png

「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。