Googleの新しい音声合成サービス「Cloud Text-to-Speech」は、32種類の声と12種類の言語で自然な音声を合成する。開発者はビジネス向けアプリや機器にこのソフトウェアを組み込むことができる。
Googleが提供を開始した開発者向け音声合成ツール「Cloud Text-to-Speech」のβ版では、対話型の音声応答botを作成したり、IoT(モノのインターネット)機器に音声機能を追加したり、文字を読むより音声を聞く方が適したワークフローを向上させたりといった用途に利用できる。
同社は2018年3月27日、「Google Cloud Platform」を通じてこの開発者向けソフトウェアの提供を開始した。同社の一般消費者向けアプリ「Googleアシスタント」「Googleマップ」「Google検索」などは既にこの機能を利用している。
「私たちは、音声を使う場面といえば電話や対面の会話ぐらいだと思い込みがちだ」と調査分析会社J Arnold & Associatesの社長、ジョン・アーノルド氏は語る。「このサービスは音声と発話の使い方を広げ、とても興味深い手法でオーディオの可能性を拡大するだろう」
GoogleのCloud Text-to-Speechは、32種類の声と12種類の言語から選ぶことができ、声のピッチや話す速さ、音量をカスタマイズできる。開発者はこのソフトウェアを電話やPC、タブレット、テレビや人工知能(AI)スピーカーなどのIoT機器に組み込める。Cisco Systemsはコラボレーションプラットフォーム「Spark」でこのサービスを利用している。
このサービスは、Googleが2014年に買収したDeepMindの機械学習ツールを使っている。これによって従来の合成音声より自然な音声の合成を実現した。DeepMindが開発した「WaveNet」は、これまでのように短い発話をつなげるのではなく、音声を一から合成する。Googleの音声検索で実際に収集した人の音声の膨大なデータを解析することにより、WaveNetのニューラルネットワークは自然な発話の波形や声のトーンの適切な流れを識別できる。
Googleはエンタープライズ市場への参入を進めており、今回のサービスの投入はその最新の動きだ。2018年3月にはこれ以外に「Hangouts Chat」というチームコラボレーションアプリも一般公開しており、「Slack」や「Microsoft Teams」との競争に参戦した。今回のCloud Text-to-Speechは、ビジネス向け音声合成API市場でAmazon.comの「Polly」やIBMの「Watson」と真っ向から対抗する。
アーノルド氏は、Googleが「MicrosoftのOfficeアプリケーションに対抗するだけでなく、他の分野でも張り合える重要なパートナーとして企業に認識してもらう」狙いがあるといい、GoogleはAI分野で「強力な地位を築いている」と評した。
Nemertes Researchでアナリストを務めるアーウィン・レイザー氏は、仮想アシスタントや顧客対応の対話型音声応答(IVR)システムなど音声対応システムの開発にこのサービスを利用すれば、音声機能を向上できるという。
Copyright © ITmedia, Inc. All Rights Reserved.
DXが進み、レガシーシステムからの脱却が喫緊の課題となっている今。「ERP×ノーコードツール」のアプローチで基幹システムの刷新に取り組む企業が増えている。そのアプローチを推進するに当たってのポイントを解説する。
DXの本質は、デジタル技術を駆使して変化に適応する能力を身につけることにある。その手段の1つとして注目を集めているのが、ローコード/ノーコード開発ツールだ。京王グループなどの事例とともに、その特徴やメリットを紹介する。
DX人材の重要性が高まる中、ノーコードツールの活用によって業務改革と人材育成を両立しようとする動きが活発化している。年間約780時間の工数削減を実現した京セラをはじめとする5社の事例を基に、その実態を探る。
急速に進化するデジタル技術は、製造業などのものづくりの現場にもさまざまな恩恵をもたらしている。しかし、設備点検業務や棚卸業務などの立ち仕事や移動が多い現場では、いまだにアナログ業務が残存し、効率化の妨げとなっているという。
あらゆる業界でDXの重要性が増しているが、工場や倉庫の中にはデジタル化が後回しにされている隙間業務が多数ある。その理由を明らかにした上で、それらの業務をモバイルアプリでデジタル化し、現場DXを推進する9社の事例を紹介する。
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。