ディープラーニングによる非構造化データの徹底活用Computer Weekly製品ガイド

ディープラーニングは、「顧客を理解する」というカスタマーインサイトチームの目標達成を支援できる。

2018年07月02日 08時00分 公開
[Brandon PurcellComputer Weekly]

 リアルタイムで生成される大量の構造化/非構造化データを使って、顧客について幅広く理解する役割を担ったカスタマーインサイトのプロフェッショナルにとって、ディープラーニングの利用には多大なメリットがある。

 多くの組織では、コールセンターの通話記録や顧客からの電子メールという形で、大量のデータが活用されないまま放置されている。こうしたデータには、カスタマーエクスペリエンスに関する貴重な情報が含まれている。電子商取引サイトには、分類や分析の対象となるべき製品の画像データが大量に存在する。これらの非構造化データソースでも、ディープラーニングを活用すればカスタマーインサイトの向上に役立てることができる。

会員登録(無料)が必要です

 ほとんどの場合、何もないところから始める必要はない。ディープラーニングは、サプライヤーが提供する音声、画像、自然言語処理(NLP)のクラウドサービスに組み込まれている。使用事例は豊富にあり、そうした機能の多くは専門家でなくても活用できる。

 小売り、製造、金融、医療福祉、政府機関などのさまざまな業界について、Forresterは確立された3つの用途を特定し、ディープラーニングに基づいてそれを導入するための選択肢を挙げている。

未活用データ

 第一に音声分析が挙げられる。音声分析ツールは、ディープラーニングを使って話し言葉を理解し、解釈する。こうした技術は一般的に、

  • 話し言葉の内容を「聞き取る」音響音声分析
  • 音声から文字への変換
  • 文字の内容を理解する文字分析

という3要素で構成される。

 コールセンターインサイトを担当するカスタマーインサイトプロフェッショナルは、音声分析ツールを使って顧客が抱える課題を洗い出し、コールセンターの記録に潜むリスク分野を特定できる。「Nice」や「CallMiner Eureka」といった製品は、Nuance Communicationsのディープラーニングモデルを使って音声を認識し、さまざまなトピックに基づいて音声データの分析と分類を行う。

 だが、そうしたソリューションのトレーニング用に公開されている音声データは、文字や画像の分析ツールのトレーニング用データに比べて多様性も確実性もはるかに及ばない。音声分析サプライヤーと手を組んで、自社のデータでソリューションを再トレーニングし、顧客との会話の中で最も大切な要素を拾いだすことを学ばせる必要がある。

 ディープラーニングの応用によって真の向上を図ることができる2つ目の分野は、従来の文字分析だ。これはキーワード分析に大きく依存する。2016年にカスタマーインサイトのプロフェッショナルを対象に実施した調査では、顧客からの構造化されていないフィードバックを分析してインサイトを引き出しているという回答は、わずか27%だった。そうしたデータが顧客の考え方や関心事、感情を知るための豊富な情報源であることを考えると、これは残念な状況だ。

 加えて、カスタマーインサイトチームは構造化された文字分析の結果を別のモデルにインプットして、例えば変動予想などに利用することもできる。中には文字分析を使って、カスタマーサービスや対話型商取引用のチャットbot開発の一助としているカスタマーインサイト担当者もいる。

 文字分析は新しい分野ではない。だがディープラーニング機能を確立しているサプライヤーは少数にとどまる。Amazon、Baidu、Google、IBM、Microsoftが提供するクラウドサービスは、NLPと文字解析のためのAPI(アプリケーションプログラミングインタフェース)を提供している。他にも数社が文字分析のためのディープラーニング製品を開発してきた。Cortical.ioはNumentaの階層一時記憶モデルを文字分析に活用している。Gamalonは同社のNLPエンジンの原動力とするため、「Bayesian Program Synthesis」(BPS)と呼ばれるアルゴリズムを開発した。

 ディープラーニングはまた、画像認識を極めて高い精度で強化できる。多くの場合、それは人間の能力を上回る。ディープラーニングを利用すれば、モデルトレーニングで使ったものとは異なる新しい画像の分類や解析を行ったり、画像内のオブジェクトを特定したり、画像そのものを理解したり、画像についての説明文を作成したり、画像について分かっていることと照らし合わせて類似点をリアルタイムで見つけ出したりすることもできる。

 例えばカスタマーインサイトチームは、ソーシャルメディアの画像データを分析して顧客のライフスタイルについて理解を深め、セグメンテーションモデルを強化できる。

 画像分析のサブカテゴリーである感情認識では、いずれカスタマーインサイトのプロフェッショナルが、店頭で顧客のイライラを検知して緩和することも可能になるかもしれない。

 Crimson HexagonやTalkwalkerといったソーシャルメディアモニター企業の多くは、ソリューションの一環として画像分析の提供を始めている。感情認識の分野は現在、Affectivaがリードしている。自分たちで画像データを収集している技術通のカスタマーインサイトプロフェッショナルであれば、Amazon Web Services(AWS)やGoogle、IBM、Microsoft、Salesforce.comがAPIとして提供するトレーニング済みモデルも利用できる。

 もっと領域を絞って応用するためには、カスタマーインサイトプロフェッショナルが自分たちで独自のモデルを構築する必要がある。「Caffe」のような一部のディープラーニングフレームワークは画像分析に特化しているが、大部分は

「TensorFlow」のようにもっと汎用(はんよう)的で、画像やビデオ認識の他にも垂直領域向けにトレーニングして利用できる。

着手する方法、初級から上級まで

 企業が独自のディープラーニングを研究・開発する必要はない。そうしたアルゴリズムはオープンソースソリューションとして無償で利用できる他、商用機械学習製品の中で利用できるものも増えている。それよりも、チャンスはディープラーニングの用途にうまく当てはまるビジネス問題を見極めることにある。質の良いデータを大量に集め、適切な戦略を適用してモデルを構築し、それをトレーニングしてテストすることだ。

 ディープラーニングに着手する最も簡単な方法は、既にトレーニングされたモデルを使うことだ。トレーニング済みのモデルに完全依存することも、トランスファーラーニングというプロセスを通じて自分たちのデータで向上を図ることもできる。トランスファーラーニングはディープラーニングの主な利点の1つであり、何もないところから始めるのではなく、既存のモデルの上に構築することができる。この方法であれば、大量のトレーニングデータは必要ない。

 トレーニング済みモデルは、画像、音声、文字分析で利用できる。例えば画像認識に関心のあるカスタマーインサイトプロフェッショナルは、大量の画像データでモデルのトレーニングを行ってきたClarifai、Google、IBM、Salesforce.comといった企業のAPIを活用できる。

 中間段階として、ローコードのアプローチを取ることもできる。ディープラーニングの利用を民主化するため、一部のサプライヤーはローコードプラットフォームを開発した。

 「万人のためのAI」を掲げるBonsaiは、シンプルなプラットフォームを提供して、基本的なコーディングスキルを持つデータサイエンティストがディープラーニングなどの機械学習アルゴリズムにアクセスできるようにしている。従来型の機会学習製品に、ディープラーニングを組み込む企業もある。例えばH2O.aiはGoogleがオープンソースで提供しているTensorFlowを自社製品に組み込み、SASは自社のプラットフォームで独自のディープラーニングアルゴリズムを提供している。

 企業が最も深く関与するのは、独自のモデルを構築するアプローチだ。特殊性が極めて高いデータと用途を持つ企業は、ディープラーニングのニューラルネットを最初からトレーニングする方を好むかもしれない。この場合、社内のデータサイエンティストを使ってニューラルネットのライブラリであるサプライヤーのディープラーニングプラットフォームに「自前のデータの持ち込み」を行う。

 トレーニング済みのモデルと違って、そうしたアルゴリズムはデータを見たことがなく、世界についての先入観を持たない白紙状態にある。開発者は「MXNet」、Caffe、TensorFlowのようなオープンソースライブラリをダウンロードすることも、サプライヤーの機械学習製品に組み込まれたライブラリを使うこともできる。

人間のような知性

 ディープラーニング革命の行き着く先は、周辺の世界を感じ取ることのできる人間のようなアプリだ。目的が顧客の感情の段階を評価することであれ、電話の会話の意図を把握することであれ、あるいは何千ページもの文字コードを読み取ることであれ、ディープラーニングは中枢神経になる。

本稿はForresterの報告書「Deep learning: The start of an AI revolution for customer insights professionals」より抜粋。

Copyright © ITmedia, Inc. All Rights Reserved.

新着ホワイトペーパー

製品資料 グーグル・クラウド・ジャパン合同会社

約80%の企業でAIが定着していない? その理由と成功させるためのポイントとは

生成AIを活用して業務や顧客体験の再構築を進める動きが活性化しているが、その多くが、PoCやラボ環境の段階にとどまっている。なぜなら、生成AIの可能性を最大限に引き出すための、インフラのパフォーマンスが不十分だからだ。

市場調査・トレンド グーグル・クラウド・ジャパン合同会社

ソフトウェア開発ライフサイクルにおける、生成AI活用のポイントを考察する

昨今のソフトウェア開発では、AIコーディングアシスタントの活用が主流になっている。しかし、最適なコーディングアシストツールは、開発者や企業によって異なるという。導入の際は、どのようなポイントに注意すればよいのか。

製品資料 グーグル・クラウド・ジャパン合同会社

データベースをモダナイズし、生成AIを最大限に活用する方法とは?

生成AIの活用にはデータベースが重要となるが、従来のデータベースは最新テクノロジーに対応できないなどの課題がある。本資料では、データベースをモダナイズし、生成AIを用いてビジネスイノベーションを生み出すための方法を探る。

製品資料 グーグル・クラウド・ジャパン合同会社

検索体験と結果の質をどう高める? ユーザーに喜ばれる検索体験を実現する方法

ビジネスにおいて、検索体験およびその結果の質の向上が重要なテーマとなっている。顧客はもちろん、自社の従業員に対しても、実用的な答えをより迅速に、手間なく入手できる環境の整備が求められている。

事例 グーグル・クラウド・ジャパン合同会社

検索の効率化からデータ活用まで、生成AIの業務組み込み事例5選

登場以来ビジネスへの活用方法が模索されてきた生成AI。近年では業務組み込みにおける具体的な成功例が数多く報告されている。本資料では、5件の生成AI活用事例を交えて、業務に組み込む上での具体的なアプローチを解説する。

From Informa TechTarget

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。

ITmedia マーケティング新着記事

news025.png

「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。

news014.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news046.png

「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。