音声認識のキラーアプリはなぜ生まれないのかなかなかブレイクしない原因は……

音声認識技術が大幅に改良され、セキュリティと認証の問題への対策が講じられるには、まだ数年はかかるだろう。

2007年08月24日 05時00分 公開
[Zeus Kerravala,TechTarget]

 音声認識技術は盛んに宣伝されているが、これまでのところ、触れ込み通りの威力を発揮していない。音声認識技術が本当に役立つものになるには、自然言語を解釈する能力の向上が必要だ。それが実現すれば、音声が多くのアプリケーションに統合され、われわれの情報アクセスのあり方は大きく変わるだろう。

 先日、わたしは西海岸から飛行機で帰るとき、フライト状況を確認しようと思って航空会社の「音声認識対応」コールセンターに電話した。そして分かったのは、その「音声認識対応」応答システムのプロセスが、プッシュホンのボタンを押して発信するDTMF(dual-tone, multi-frequency)信号による応答システムと何ら変わらないということだった。電話をかけて最初にしなければならなかったのは、自分のフリクエントフライヤー番号を「口頭で伝える」こと。次のステップは「フライト情報」と言うか、数字の1を押すことだった。続いて、数字の2を押す代わりに「出発」と言うよう求められた。こうしたプロセスが延々と続いて、やっと目的の情報が手に入った。うんざりするほど時間がかかってしまった。

 このシステムは、キーを操作しても、音声でアクセスしても、まったく同じ情報ツリーをたどるようになっていた。そのプロセスの所要時間は、どちらの場合もほぼ同じというわけだ。理想を言えば、所定の番号に電話して「X市からの123便の出発情報」と言うと、システムがそれを解析して情報を返すようになっていてほしかった。音声アクセスが本当に便利になるには、ユーザーが要求を出したときに、生身の相手と話す場合と同様な体験ができるレベルまで進化を遂げなければならないと、わたしは強く考えている。

関連ホワイトペーパー

コールセンター | コンタクトセンター | CRM


ITmedia マーケティング新着記事

news171.png

2024年のGW予算は横ばい 賃上げよりも物価高と円安の影響が勝る?――インテージ調査
インテージが全国の15歳から79歳の男女を対象に実施したゴールデンウイークに関する調査...

news148.jpg

CNN幹部が語る、メディアビジネスにとってのAIのリスクと機会
生成AIがコンテンツを量産し、真偽の明らかでない情報があふれかえる中、メディアの価値...

news016.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2024年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。