音声認識と拡張現実がモバイルアプリの主戦場になる理由モバイルアプリ開発の最前線(後編)

モバイルアプリに限らず、音声認識や拡張現実の重要性は高まっていく。それはなぜなのか。開発者はどの技術に注目すべきか。今後のために何をすべきなのか。

2018年04月27日 08時00分 公開
[Rob BamforthComputer Weekly]
Computer Weekly

 前編(Computer Weekly日本語版 4月4日号掲載)では、多様化するサイズやフォームファクターに対応するための開発ツールたちを紹介した。

 後編では、音声や拡張現実への対応について検討する。

Computer Weekly日本語版 4月18日号無料ダウンロード

本記事は、プレミアムコンテンツ「Computer Weekly日本語版 4月18日号」(PDF)掲載記事の抄訳版です。本記事の全文は、同プレミアムコンテンツで読むことができます。

なお、同コンテンツのEPUB版およびKindle(MOBI)版も提供しています。

ボタンボタン

「話し相手」になるモバイル端末

 音声認識はSFで長く取り上げられてきたテーマで、1980年代初頭から何らかの形で存在している。そしてその人気は昨今、インターネットに接続されるスマートスピーカーによって急成長した。進化を続けるこの音声ユーザーインタフェースは、Amazonが「Alexa」で必要としているだけではない。主なテクノロジー企業も市場でチャンスをつかもうと準備を進めている。「Siri」「Googleアシスタント」(同社の「Google Now」と似ているがより人工知能要素が強い)、Microsoftの「Cortana」、Samsungの「Bixby」など、さまざまなパーソナルアシスタントが登場した。また、IBMの自然言語人工知能(AI)プラットフォーム「Watson」もその1つだ。

 これらのパーソナルアシスタントのモデルは全て、「スキル」と音声コマンドをリンクすることに基づいている。「スキル」とは何らかの操作を指し、典型的なAI対応のバックエンドによって結果として実行される。つまり、構築するエコシステムには音声認識技術とAIプラットフォームだけでなく、この「スキル」も含まれる。

 Siriはパーソナルアシスタントの先駆けの1つだが、Appleは他機器への拡張に慎重で、まだ閉ざされたシステムと見なされている。Microsoftは、自社の開発者遺産、非常に多岐にわたる開発製品(「Microsoft Azure」でクラウドネイティブなアプリケーションをサポートする「Cortana Intelligence Suite」など)を強みにしてパーソナルアシスタント市場に切り込んでいる。一方Googleはあの手この手のアプローチを取ってはいるが「スキル」の量の点で遅れている。そしてBixbyはSamsung製端末のサブセットでしか機能しない。

 最も先を進んでいるのがAmazonだ。Alexaで市場の波を取り込んでいるだけでなく、スキルの強力なエコシステムを作り出している。同社はこれを「Alexa Skills Kit」でサポートする。Alexa Skills KitはセルフサービスのAPI、ツール、ドキュメント、コードサンプルをまとめたものだ。

 これが重要なのは、他のプラットフォーム戦争と同じように、強力なエコシステムとサポートが不可欠になるためだ。開発者はどのプラットフォームが成功を収めるかに賭けることになる。そのため開発者が求めるのはツール、テンプレート、安定したAPIだけではない。信頼できるユースケースに対して市場性のあるソリューションを構築するための、適切なレベルのビジネスサポートも欠かせない。

 音声対応のコマンドとコントロールを扱っているのは大規模ベンダーだけではない。アイルランドの新興企業Voysisは、企業が音声入力を自社の製品、データ、ブランドに合わせて調整できるようにする独自の手法を開発している。他にもこの分野の新興企業にはConvessa、Smartly、Snipsなどがある。だが新興企業のMindMeldが最終的に落ち着いた場所(Cisco Systemsによる買収)を見ると、この分野は急速に成熟を遂げ、統合へと進んでいることが分かる。

 機器がウェアラブル化したり自宅や職場の棚の背後に姿を消したりしていくたびに、音声コマンドの重要性は増していく。1970年代のSFで描かれたレベルに達することは決してないかもしれないが、音声駆動の「スキル」を設計に組み込む最適な方法を、製品とアプリケーションの開発者が知っておくのは非常に有益だろう。

拡張現実

 音声と並んで視覚の強化も見られる。

ITmedia マーケティング新着記事

news038.jpg

生活者の生成AI利用動向 10代後半はすでに5割近くが経験――リクルート調査
テキスト型生成AIサービスの利用経験者の割合は若い年代ほど高く、特に10代後半はすでに5...

news108.jpg

今度の「TikTok禁止」はこれまでとどう違う?
米国ではまたしてもTikTok禁止措置が議論されている。これまでは結局実現に至らなかった...