オンプレミス再考の今、Clouderaが狙う「プライベートAI」の潮流とはLLMより小規模モデルのトレンドも

LLMの発展を機にAI活用の機運が高まる中で、今後トレンドになる可能性が指摘されているのが、プライベートAIや小規模のモデルだ。データ基盤を提供するClouderaはユーザー企業をどう支援するのか。

2025年06月06日 07時30分 公開
[渡邉利和]

 大規模言語モデル(LLM)の発展から一気にAI(人工知能)ブームが巻き起こった昨今だが、検証段階から実運用のフェーズに移行していくにつれ、さまざまな課題も浮かび上がってきた。中でも重視するユーザー企業が多い点が、データのセキュリティだ。

 AIモデルの価値は、最終的には学習させたデータの品質に左右されるため、社内に蓄積されているさまざまなデータの価値がこれまで以上に高まっている。その重要なデータを社外に出すことなくAI技術で活用したいというニーズもまた高まっており、パブリッククラウドではなく、自社ネットワーク内部でAI技術を活用していこうとする、いわゆる「プライベートAI」に対する注目が高まっている。

 プライベートAIの実現にはデータ管理プラットフォームの整備が不可欠となる。この分野に強みを持つClouderaは、統合データプラットフォームにおけるAIアプリケーションのサポートを大幅に強化し、AI活用に取り組むユーザー企業を支援する。今後、AI活用が本格化するトレンドを同社はどう見ているのか。

“オンプレミス見直し”の中、Clouderaの強みは

 Clouderaの吉田栄信氏(ソリューション・エンジニアリング・マネジャー)はまず、同社の強みとして「もともとオンプレミス向けの製品だったこともあり、オンプレミスでデータレイクハウスを構築できる」点を挙げる。

写真 Clouderaの吉田栄信氏

 「データレイクハウス」は、リレーショナルデータベースなどに格納される構造化データを分析に適した形に加工し、格納しておくための「データウェアハウス」(DWH)と、大量の非構造化データなどを格納できる「データレイク」を合わせた言葉だ。構造化データと非構造化データの両方を格納し、高度な分析などを可能にするデータ基盤となる。

 現在ではクラウドネイティブな新興ベンダーが最初からクラウドを前提に開発したアーキテクチャに基づくデータレイクハウスをSaaS(Software as a Service)として提供して人気を集めている。その一方、一時期のクラウドシフト傾向が一段落し、クラウドとオンプレミスを適材適所で使い分けるハイブリッド指向が強まる中で、オンプレミスベースの製品やサービスの価値が見直される状況になってきている点は面白いところだ。

 Clouderaは主要パブリッククラウド上で同社のデータプラットフォームをPaaS(Platform as a Service)として提供している。競合他社の多くがSaaSとしての提供なのに対して「ユーザー企業のアカウント上にデータレイクハウスを構築できる」(吉田氏)点が差別化ポイントとなっているという。

最新トレンドとしての「プライベートAI」

 吉田氏は、ユーザー企業のAI活用に関しては「専門人材の不足」と「高額なコスト」の2つのハードルがあると指摘。同社では新たに提供する「AI Studio」と従来からの強みであるハイブリッド環境のサポートによって支援が可能だとする。

 同社のプラットフォームはバブリッククラウドやオンプレミスを共にカバーする「ハイブリッドなインフラ」上に、統合データファブリック「Cloudera SDX」と「オープンデータレイクハウス」を構築していたが、2025年からは新たに「AIアプリケーション」層を最上位に加え、「データ分析とAIのための唯一の真のハイブリッドクラウドプラットフォーム」を標榜している。

 AIアプリケーションの中でも、AI専門人材の不足に悩むユーザー企業の支援策となるのが「AI Studio」で、以下の4つの機能を含む。

  • RAG Studio
    • プロンプトに追加情報として付加するためのデータを生成する
  • Fine Tuning Studio
    • 使いやすいGUIでファインチューニング機能を提供する
  • Synthetic Data Studio
    • ファインチューニングに使用するための合成データを生成する
  • Agent Studio
    • AIエージェント作成を支援する

 AI Studioは、最新のAI関連機能をノーコード(コード記述なしの開発)からハイコード(コード記述中心の開発)まで、さまざまなレベルのエンジニア向けに提供しており、AI人材が不足しているユーザー企業でもAI Studioを活用することで効果的なAI開発が可能になるという。

図版 AI開発を支援するAI Studio(出典:Cloudera資料)《クリックで拡大》

 現在、業界各社が積極的な取り組み姿勢を見せている「AIエージェント」について吉田氏は、「AIを活用した自動処理のワークフロー」だと説明する。LLMではあるトピックに関して対話を行い、ユーザーの問いに答えることもできるが、対話以上のことは実行しない。たとえば金融機関のユーザーサポートのイメージで、「口座開設の手順を教えて下さい」と問えば具体的な手順や注意事項などを解説してくれるだろうが、口座開設手続きをユーザーに代わって実行してくれるわけではない。AIエージェントはそのギャップを埋めて口座開設の具体的な手順をワークフローとして実行してくれる。こうしたAIエージェントを作成するための具体的な開発プロセスを支援してくれるのがAgent Studioという位置付けになる。

 同氏はAIエージェント作成の具体的な難しさの例として、「処理を実行するためのトリガーとなるキーワードを対話の中から抽出する必要があるが、素のLLMだとそのキーワードを踏まえてさらに別の話題に膨らませてしまうなど、トンチンカンな対応になってしまうことも珍しくない」と指摘する。こうした状況に対して、「こういうキーワードが対話の中で出てきたら、口座開設エージェントを呼び出す」という対応関係をあらかじめ学習させておくという「ファインチューニング」を実施することで精度向上を実現できる。

 Fine Tuning Studioはそのための支援ツールとして用意されているが、さらに面白いポイントは、ファインチューニングを前提とした場合、トップレベルの大規模モデルよりもむしろ小〜中規模のモデルの方が高精度を達成できる場合があるという点だ。もともと膨大な量のパラメーターが設定されている大規模モデルの場合、ファインチューニングで学習させた追加データの影響が相対的に小さいと考えることもできるが、同社が実施したPoC(概念実証)におけるベンチマークの結果では、ファインチューニングなしでは全く精度が出なかった小〜中規模モデルが、ファインチューニング実施後には大規模モデルを凌駕(りょうが)する精度を達成した例が見られるという。こうした成果を踏まえて吉田氏は、「ファインチューニング済みの小〜中規模モデルを自社でホストすることがトレンドになる」と予測する。

図版 Clouderaによるベンチマークテスト(出典:Cloudera資料)《クリックで拡大》

 最先端の大規模モデルは、パブリッククラウド上のサービスとして不特定多数のユーザー向けに対話サービスを提供するような場合には極めて強力なツールとなるが、企業内で特定のタスクを実行するために用意したAIエージェントに処理を振り分けるような限定的な用途の場合はむしろファインチューニングを実施した小〜中規模のモデルの方が精度が高く、かつ低コストで運用できる可能性が高い。ファインチューニング用のデータとして社内の機密データを活用するような場合も考えれば、小〜中規模のモデルを相対的に小規模な社内インフラ上で稼働させる「プライベートAI」が最適解となる企業は少なくないだろう。

 この場合、オンプレミスでもクラウドと同様の機能を利用可能なハイブリッドなプラットフォームが有用であり、AIアプリケーションの規模拡張や用途の拡大などの状況に応じてオンプレミスとクラウドを自由に行き来できる柔軟性も確保できるだろう。AIエージェントの本格活用を見据えると、オンプレミスでAI開発をサポートできる統合データプラットフォームの整備に今から着手すべきなのかもしれない。

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ

From Informa TechTarget

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...