AI開発でPostgreSQLが定番になった”切実な”理由:「コスト削減用DB」から脱却
Microsoftによると、生成AI時代のデータ基盤としてPostgreSQLの重要性が高まっており、OpenAIなど大規模サービスでも採用が進んでいるという。その理由は。
企業のデータベース戦略が変わり始めている。これまでオープンソースのデータベースは「コストを抑えるための代替手段」と見なされることが多かった。しかし近年は、AI(人工知能)時代を見据えた“戦略的な基盤”として採用する企業が増えている。その中心にあるのが「PostgreSQL」だ。なぜ今PostgreSQLなのか。Microsoft AzureのPostgreSQL/MySQL製品戦略を統括するチャールズ・フェダーセン氏が2026年4月30日に公開した見解を紹介する。
なぜ今PostgreSQLなのか
併せて読みたいお薦め記事
バイブコーディングがOSSを破壊する
フェダーセン氏によると、生成AIブームやコスト圧力、クラウドネイティブ化の流れを背景に、企業が新規アプリケーションの基盤としてPostgreSQLを選択するケースが増えているという。AIワークロードの増加によって、PostgreSQL市場では何が起きているのか。
「AI時代のデータベース」として存在感
PostgreSQLは、ベクトル検索や埋め込み(Embeddings)、RAG(検索拡張生成)パイプラインなど、生成AI関連機能を拡張しやすい点が特徴だ。Microsoftは、「セキュリティ」「性能」「信頼性」「運用性」を維持しながらAIワークロードをスケールできる基盤として、PostgreSQLの優位性を強調している。
実際、大規模なAIサービスでもPostgreSQL活用が進む。OpenAIは約8億人規模のChatGPTユーザーを支える基盤の一部としてPostgreSQLを利用しているという。また、製造業向けソフトウェア企業PTCは、柔軟性やコスト最適化、性能向上を目的に、独自のデータベースから「Azure Database for PostgreSQL」へ移行した。
“必要以上に高いストレージ”問題を解消
Microsoftは2026年、Azure Database for PostgreSQL向けに「Premium SSD v2」を正式提供開始した。従来のクラウドストレージでは、IOPS(HDDやSSDなどのストレージが1秒当たりに処理できるデータの入出力回数)やスループットを高めるために、不要な大容量ディスクを購入する必要があった。
Premium SSD v2では、「容量」「IOPS」「スループット」を個別に調整できる。これによって、必要な性能だけを選択でき、過剰なストレージ投資を避けやすくなる。さらに、停止時間なしで設定変更できるため、AIアプリケーションのように負荷変動が大きいワークロードにも対応しやすい。
Microsoftの検証では、従来のPremium SSDと比べて性能が279%向上し、負荷時のレイテンシを約15ミリ秒削減したという。月額コストを維持したまま、最大169%高いスループットを実現したとしている。
AI時代に重要になる「読み取り性能」
AIアプリケーションやグローバルSaaSでは、世界各地から大量の読み取りアクセスが発生する。この課題に対応するため、Microsoftは「カスケード型読み取りレプリカ」も強化している。
従来の構成では、全ての読み取りレプリカがプライマリDBへ直接接続していた。そのため、レプリカ数が増えると、プライマリ側の負荷が急増する問題があった。
一方、カスケード型読み取りレプリカでは、中間レプリカがさらに下位レプリカへ更新ログを転送する多段構成を採用する。これによって、プライマリDBへの負荷を抑えながら、最大30台までレプリカを拡張できる。OpenAIはこの方式によって、大規模環境でもほぼゼロに近いレプリケーション遅延を維持しているという。
この構成は、地域ごとに低遅延アクセスを提供したいSaaS事業者や、災害対策向けのDR(災害復旧)環境にも有効だ。
「オープンソースは不安」が変わる?
これまで企業がPostgreSQL移行をためらってきた理由の1つに、「オープンソースは運用が不安」「性能が足りないのではないか」という懸念があったとフェダーセン氏は指摘する。
Microsoftは、2026年時点でその状況は変わったと説明する。Premium SSD v2やカスケード型読み取りレプリカに加えて、「Microsoft Entra ID」「Key Vault Encryption」「Private Endpoints」などのエンタープライズ機能を組み合わせることで、企業向け基盤として成熟したという立場だ。
さらに重要なのがコスト構造だ。生成AIや分析用途ではデータ量とアクセス量が急増しやすい。独自DB製品ではライセンス費用や性能向上コストが膨らみやすい一方、PostgreSQLはオープンソースゆえに、ワークロード拡大時のTCO(総保有コスト)を抑えやすい。
Microsoftは、「企業はデータベースを乱立させるのではなく、統合する方向へ向かっている」と指摘する。重要なのは「今の制約を最適化すること」ではなく、「今後10年の成長を支えられる基盤を選ぶこと」だという。
Copyright © ITmedia, Inc. All Rights Reserved.