アップデートされたGoogleの音声認識テキスト変換サービスは、機械学習により精度が向上した。Googleは、変換されたテキストに自動的に句読点を追加するツールもリリースしている。
Googleの音声認識テキスト変換サービス「Cloud Speech-to-Text」は、通話や動画の音声を明確にテキストに変換するように設計されたモジュールを用いてアップデートされた。開発者は、これらのテキスト変換サービスをコールセンターのソフトウェアやWeb会議プラットフォームに組み込むことができる。
Googleは、顧客から提供を受けたデータを使用することで、文字起こしの正確さを大幅に改善したことを明らかにした。機械学習ツールにより、単語の誤りは半分以下に減ったという。
今後、顧客は利用データの共有をGoogleと同意することで、さらに高度なサービスの恩恵を得ることができる。もちろん、プライバシーに懸念を抱く顧客は、このプログラムに参加しないことも可能だ。
2016年にリリースされたGoogle Cloud Speech APIは、電話やビデオの音声からの文字起こしに加え、長時間の音声ファイルをテキストに変換するための標準プログラムを含んでおり、音声の検索や音声コマンドをサポートしている。
Googleは2018年4月、音声メールの文字起こしの品質を改善するために、社内で過去数年間利用してきた句読点自動挿入ツールのβ版を公開した。これにより、ピリオド、コンマ、疑問符を音声から書き起こした文章へ自動的に挿入することができる。
GoogleによるCloud Speech-to-Textに関する改良は、Amazon Web Services(以下、AWS)が一般デベロッパー向けテキスト転換プラットフォームであるAmazon Transcribeの開発を公表してから1週間もたたないうちに発表された。
Amazon Transcribeにおいて、企業は、それぞれの業務に特有の頭字語とキーワードを含めるよう、語彙をカスタマイズすることができる。また、AWSは、音声ファイル内の複数の発言者を区別できるようにサービスをアップデートした。
AWSとGoogleは、同様のサービスを提供するIBM WatsonやMicrosoft Azureとも競合している。「音声認識テキスト変換をより広く利用するための大規模な競争が起きている。音声認識テキスト変換は、これら全てのベンダーが現在取り組んでいることの中核をなす、非常に重要な部分だ」と、Wainhouse Researchのスティーブ・ヴォンダー・ハール氏(上級アナリスト)は語る。
Copyright © ITmedia, Inc. All Rights Reserved.
契約業務の効率化やコストの削減といった効果が期待できることから、多くの企業で「電子署名」の導入が進んでいる。一方で、訴訟問題へと発展した際に証拠として使えるのかといった疑問を抱き、導入を踏みとどまるケースもあるようだ。
半導体ベンダーBroadcomは仮想化ベンダーVMwareを買収してから、VMware製品の永久ライセンスを廃止した。その永久ライセンスを継続する非公認の方法とは。
クラウドファーストの流れが加速する中、無計画に構築されたハイブリッドクラウドの弊害が多くの企業を悩ませている。ITオペレーションの最適化を図るためには、次世代のハイブリッドクラウドへのモダン化を進めることが有効だ。
ワークロードを最適な環境に配置できる手法として注目され、多くの企業が採用しているハイブリッドクラウド。しかし、パフォーマンス、法令順守、コストなどが課題となり、ハイブリッドクラウド環境の最適化を難しくしている。
システム基盤をオンプレミスで運用するか、データセンターやクラウドで運用するかは、業種によって大きく異なる。調査結果を基に、活用の実態を探るとともに、最適なクラウドサービスを考察する。
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年4月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...
Cookieを超える「マルチリターゲティング」 広告効果に及ぼす影響は?
Cookieレスの課題解決の鍵となる「マルチリターゲティング」を題材に、AI技術によるROI向...