非構造化データのための「ベクトル検索」にも着目 MicrosoftのAI向け新機能:Microsoftデータ分析ツールの進化【後編】
Microsoftは2023年11月のカンファレンスで、AI技術を活用した新製品や新機能を発表した。データベース分野ではどのような発表があったのか。
テキストや画像などを自動生成するAI(人工知能)技術「生成AI」(ジェネレーティブAI)は今後、企業のさまざまな業務で活用されると考えられる。企業はAIモデルを訓練する際、膨大な学習用データを用意する必要がある。
Microsoftは2023年11月に開催した同社の年次ユーザーカンファレンス「Microsoft Ignite 2023」で、人工知能(AI)を活用する新製品や新機能を発表した。その中にはベクトル検索機能の追加など、生成AIとデータベースに関連する新機能も含まれていた。その一部を紹介する。
Microsoftが発表した「ベクトル検索」などのデータベース機能とは?
併せて読みたいお薦め記事
連載:Microsoftデータ分析ツールの進化
- 前編:データ分析ツール群「Microsoft Fabric」とは OneLake、BIをまとめた利点は?
- 中編:Copilot搭載の「Microsoft Fabric」で“データ専門家の仕事”はどう変わるのか?
BIツールの動向を紹介
MicrosoftはMicrosoft Ignite 2023で、「Azure Cosmos DB for MongoDB vCore」におけるベクトル検索機能の追加など、データベースの新機能を発表した。Azure Cosmos DB MongoDB vCoreは、Microsoftのツールと、ドキュメント指向データベース管理システム(DBMS)ベンダーMongoDBのツールをつなぎ、両社の顧客のアプリケーション開発を支援するものだ。
ベクトル検索は、生成AIの開発が拡大したことで重要性が高まっている機能の一つだ。生成AIモデルを訓練する際は、精度を確保するためにかなりのデータ量が必要となる。生成AIモデルに十分なデータをそろえるため、構造化データに加えて非構造化データを組み合わせることがしばしば必要になる。
例えば、財務記録や販売時点管理(POS)のトランザクションのように最初から構造化されているデータがある一方で、テキストや写真、ビデオファイルなどのデータは構造化されていない。そうした非構造化データをベクトル(数値型の構造体)形式に変換して識別子を付与することで、コンピュータによるデータの検索などの処理が可能になる。その結果、モデルの訓練に活用できるようになる。
MicrosoftはAzure Cosmos DB MongoDB vCoreのベクトル検索機能の他にも、データ管理やデータ分析に関連する新機能を発表した。その一部を以下に列挙する。
- Amazon Web Services(AWS)のクラウドストレージ「Amazon Simple Storage Service」(Amazon S3)、Microsoftのデータレイクサービス「Azure Data Lake Storage Gen2」へのショートカット機能の追加
- 外部のAmazon S3やAzure Data Lake Storage Gen2のデータと、Microsoftのデータレイク「OneLake」のデータを統合する際、データコピーを作成する必要がなくなる
- データベース「Azure SQL Database」の機能強化
- コスト削減の他、セキュリティ性能や信頼性を強化
- オフィススイート「Microsoft 365」とOneLakeの連携
- データベースサービス「Azure Cosmos DB」への新機能追加
- コスト削減や開発者の生産性向上に貢献する機能
- データベース管理システム「SQL Server」のセキュリティ機能強化
- データベースサービス「Azure Database for PostgreSQL」のAI機能追加と性能強化
TechTarget発 先取りITトレンド
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.