【製品動向】ソーシャルやビッグデータで変わる「テキストマイニング」:つぶやき分析や大規模テキスト処理が可能に
ソーシャルメディアから顧客の声を探りたい。大規模テキストを高速に解析したい。こうした声に応えて、テキストマイニング製品は着実に進化している。最新動向をまとめた。
メールや製品資料など、さまざまな形で存在するテキストから知見を得るのに役立つのが「テキストマイニング製品」である。FacebookやTwitterといったソーシャルメディアの普及やデータ量の増大といった変化に対処すべく、テキストマイニング製品の機能は進化を続けている。本稿は、テキストマイニング製品の最新動向を示す。
関連記事
- NASAが研究、旅客の命を守る「テキスト・音声分析」
- 「テキストマイニング」って何? ――事例と分析例から解説(ホワイトペーパー)
- 導入企業が選んだ、テキストマイニングツールに必要な6つの機能(ホワイトペーパー)
テキストマイニング製品の現状
利用シーンの変遷に伴い利用技術も進化
形態素解析や構文解析といった自然言語処理技術、単語間の関連性やテキスト間の類似性を見つけ出す技術などを利用し、テキストを内容別に分類したり、単語や話題の出現頻度を可視化したりするのが、テキストマイニング製品だ。
テキストマイニング製品は、1990年後半から2000年初頭にかけて、アンケートのフリーコメント分析用途で活用が進んだ。以後、2000年代中盤にはコールセンターの問い合わせ分析などに利用されはじめ、現在は特許文献の検索や分析といったマーケティング以外の分野にも活用されている。
利用シーンの変遷に合わせて、採用される技術も変化してきた。前述した形態素解析や構文解析に加え、テキストの内容が特定の物事に対してポジティブかネガティブかを判断する技術、長いテキストの中から主題を特定する要約技術などの実装が進んだ。
国産製品が充実
テキストマイニング製品は、国産製品が比較的充実している。野村総合研究所(NRI)の「TRUE TELLERシリーズ」、プラスアルファ・コンサルティングの「見える化エンジン」、クオリカの「VextMiner」といったツールは、いずれも国内市場で高いシェアを持つ。
一方、外資系ベンダーについても、「IBM Content Analytics with Enterprise Search」を持つ日本アイ・ビー・エム(日本IBM)、「SAS Text Miner」を持つSAS Institute Japanなどが国内で製品を販売する。外資系とはいえ、国内販売されているテキストマイニング製品は日本語のテキストを分析可能だ。日本IBMは、国内の東京基礎研究所で進めるテキストマイニング研究の成果を製品に反映させている。
製品動向(1):ソーシャルメディア分析が可能に
ソーシャルメディアの書き込みを企業のマーケティング活動や製品開発などに生かそうとする動きが広がりつつある。テキストマイニング製品もこうしたニーズに応えるべく、ソーシャルメディア向けの機能を搭載し始めた。ソーシャルメディアのテキストをローカルにダウンロードすることなく、リアルタイムにテキストを取得して分析可能にするのが、代表的な動きである。
関連記事
- Facebook、Twitter分析ツールの「不都合な真実」
- PR:Twitter、Facebookに対応したテキスト分析ツール、選定のための3大条件
- SNSをテキストマイニングして株価予測へ、カブドットコム証券のビッグデータ活用(ホワイトペーパー)
プラスアルファ・コンサルティングの見える化エンジンは、Twitterをはじめとするソーシャルメディアの書き込みを取得する専用APIを提供する。また、見える化エンジンを搭載したマーケティング支援ツール「カスタマーリングス」も提供。カスタマーリングスを使うと、TwitterやFacebookの書き込みをリアルタイムに監視し、プロモーションの反響を分析できる。
ソーシャルメディア分析に特化したテキストマイニング製品もある。ハンモックの「GLUE SNS」は、ソーシャルメディアの書き込みにある「食中毒」「法令違反」といったネガティブなキーワードを基に、企業や商品に対する不満が発生したタイミングやコメント内容の動向を可視化する。コンシューマーの書き込みに対してコメントを発信する機能も備える。
NRIの「TRUE TELLERインターネットモニタリングサービス」は、あるユーザーの書き込みが、他のユーザーにどう波及しているかをグラフで図示する「TRUE TELLER ソーシャルインパクト」、ソーシャルメディアでの自社に関する評価をダッシュボードとして表示する「TRUE TELLER 顧客の声ポータル4S」といったツールをそろえる。
製品動向(2):大量テキストを高速処理
大量テキストの高速解析を可能にする機能や技術を搭載する動きもある。テキストマイニングは、分析対象のデータを増やせば増やすほど、分析結果の精度が上がる傾向がある。ただし、データが増大すると処理時間が長くなるため、処理速度の向上が不可欠だ。
日本IBMのIBM Content Analytics with Enterprise Searchは、同社のHadoopソフトウェア「IBM InfoSphere BigInsights」との連係で、大量テキストの分散処理を可能にした。例えば、Twitterのつぶやきの場合、数億件を一括処理できる。
また、米SAS Instituteは2012年5月、インメモリ分析製品「SAS High-Performance Analytics」にテキストマイニング機能を追加すると発表。一般的なテキストマイニング製品で数日かかる大量データ分析を数時間で実現できるようにするという。
製品動向(3):SaaS化が進む
従来はクライアントアプリケーションやサーバアプリケーションなどのパッケージ製品として提供されることが多かったテキストマイニング製品。現在は、月額利用が可能なSoftware as a Service(SaaS)として提供する動きが進んでいる。
例えば、クオリカが2012年2月に提供開始した「VextCloud」は、同社のVextMinerの機能をSaaSとして利用できる。導入に600万円以上掛かるVextMinerと比べ、初期費用と月額料金がともに10万円から利用できたり、1カ月単位のスポット利用が可能な手軽さを訴求する。
パッケージ版を原則として用意せず、当初からSaaSのみの提供を進める動きもある。プラスアルファ・コンサルティングの見える化エンジンやカスタマーリングスは、いずれもSaaSのみの提供だ(見える化エンジンは、ユーザー企業のサーバで利用可能な「オンサイトプラン」も用意する)。
Copyright © ITmedia, Inc. All Rights Reserved.