Googleの新しい音声合成サービス「Cloud Text-to-Speech」は、32種類の声と12種類の言語で自然な音声を合成する。開発者はビジネス向けアプリや機器にこのソフトウェアを組み込むことができる。
Googleが提供を開始した開発者向け音声合成ツール「Cloud Text-to-Speech」のβ版では、対話型の音声応答botを作成したり、IoT(モノのインターネット)機器に音声機能を追加したり、文字を読むより音声を聞く方が適したワークフローを向上させたりといった用途に利用できる。
同社は2018年3月27日、「Google Cloud Platform」を通じてこの開発者向けソフトウェアの提供を開始した。同社の一般消費者向けアプリ「Googleアシスタント」「Googleマップ」「Google検索」などは既にこの機能を利用している。
「私たちは、音声を使う場面といえば電話や対面の会話ぐらいだと思い込みがちだ」と調査分析会社J Arnold & Associatesの社長、ジョン・アーノルド氏は語る。「このサービスは音声と発話の使い方を広げ、とても興味深い手法でオーディオの可能性を拡大するだろう」
GoogleのCloud Text-to-Speechは、32種類の声と12種類の言語から選ぶことができ、声のピッチや話す速さ、音量をカスタマイズできる。開発者はこのソフトウェアを電話やPC、タブレット、テレビや人工知能(AI)スピーカーなどのIoT機器に組み込める。Cisco Systemsはコラボレーションプラットフォーム「Spark」でこのサービスを利用している。
このサービスは、Googleが2014年に買収したDeepMindの機械学習ツールを使っている。これによって従来の合成音声より自然な音声の合成を実現した。DeepMindが開発した「WaveNet」は、これまでのように短い発話をつなげるのではなく、音声を一から合成する。Googleの音声検索で実際に収集した人の音声の膨大なデータを解析することにより、WaveNetのニューラルネットワークは自然な発話の波形や声のトーンの適切な流れを識別できる。
Googleはエンタープライズ市場への参入を進めており、今回のサービスの投入はその最新の動きだ。2018年3月にはこれ以外に「Hangouts Chat」というチームコラボレーションアプリも一般公開しており、「Slack」や「Microsoft Teams」との競争に参戦した。今回のCloud Text-to-Speechは、ビジネス向け音声合成API市場でAmazon.comの「Polly」やIBMの「Watson」と真っ向から対抗する。
アーノルド氏は、Googleが「MicrosoftのOfficeアプリケーションに対抗するだけでなく、他の分野でも張り合える重要なパートナーとして企業に認識してもらう」狙いがあるといい、GoogleはAI分野で「強力な地位を築いている」と評した。
Nemertes Researchでアナリストを務めるアーウィン・レイザー氏は、仮想アシスタントや顧客対応の対話型音声応答(IVR)システムなど音声対応システムの開発にこのサービスを利用すれば、音声機能を向上できるという。
Copyright © ITmedia, Inc. All Rights Reserved.
ビジネスに生成AIを利用するのが当たり前になりつつある中、ローコード開発への活用を模索している組織も少なくない。開発者不足の解消や開発コストの削減など、さまざまな問題を解消するために、生成AIをどう活用すればよいのか。
システム開発を任されても、「何から始めたらよいのか分からない」という担当者は多いだろう。そこで本資料では、システム開発の流れや専門用語といった基礎知識を分かりやすく解説するとともに、システム開発の4つの手法を紹介する。
システムの不具合によるさまざまなリスクを回避するには網羅的なテストを行う必要があるが、自社で行うのは難しい。そこで活用したいのが外部のテスト専門会社だ。本資料ではテスト専門会社を活用するメリットや具体的な流れを解説する。
レガシーシステムからの脱却が叫ばれる中、「ERP×ノーコードツール」のアプローチで基幹システムの刷新に取り組む企業が増加している。その推進に当たっては、「Fit to Company Standard」の概念を頭に入れておくことが必要になる。
迅速なサービスの提供を実現する手段として、「ローコード開発×内製化」が注目されている。エンジニア不足の中でも、非IT部門が開発を担える点がその理由の1つだが、全てが順調に進むわけではない。失敗事例から得た2つの教訓を紹介する。
「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ
ネットワークの問題は「帯域幅を増やせば解決する」と考えてはいないだろうか。こうした誤解をしているIT担当者は珍しくない。ネットワークを快適に利用するために、持つべき視点とは。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...