コード生成AI「Poolside」は一体何者? データを“集めない”独自戦略とはAWS re:Invent 2024現地レポート

AWSの生成AIサービス「Amazon Bedrock」から、AIコーディングツール「poolside Assistant」が新たに利用できるようになる。一体どのような製品なのか。

2024年12月13日 05時00分 公開
[梅本貴音TechTargetジャパン]

関連キーワード

人工知能 | 開発ツール


 Amazon Web Services(AWS)は2024年12月2~6日(現地時間)に米ラスベガスで年次イベント「AWS re:Invent」を開催し、数多の新機能を発表した。

写真 Poolsideの共同創業者兼CEOジェイソン・ワーナー氏

 12月4日の基調講演では、生成AIサービス「Amazon Bedrock」から、PoolsideのAIコーディングツール「poolside Assistant」および基盤モデル「malibu」「point」が利用可能になる計画が発表された。Poolsideは米国で設立されたスタートアップで、2024年10月には5億ドルの資金調達を完了したことで話題を集めている。

 AWS re:Inventのスタートアップ向けセッションでは、元GitHubのCTO(最高技術責任者)で、Poolsideの共同創業者兼CEOジェイソン・ワーナー氏が登壇。poolside Assistantとは一体どのような製品なのかについて、開発の背景から、具体的な特徴やユースケースまでを紹介した。

Amazon Bedrockに新登場の「Poolside」 独自戦略をCEOが解説

 ワーナー氏はPoolsideの創業前、2017~2021年までGitHubでCTOを務めた経歴を持つ。当時はソースコード共有サービス「GitHub」を、「単なるコードホスティングプラットフォーム」から「知能を持ったエンドツーエンドのソフトウェア開発プラットフォーム」に進化させるという目標を掲げていたという。

 この目標に基づき、ソフトウェア開発ツールベンダーsource{d}の買収を試みるが、実現には至らなかった。しかし、同社の創業者で後にPoolsideの共同創業者となるエイソ・カント氏との交流を通じて、ニューラルネットワークとそのソフトウェアへの応用について知見を深めていく。

 MicrosoftによるGitHubの買収後、ワーナー氏はAI(人工知能)コーディングツール「GitHub Copilot」の開発に至る。一方で、より初期のアイデアを実現しているのがpoolside Assistantだという。コーディングからテストまで、開発者が必要とするツールや機能を統合し、1つのプラットフォームからシームレスに利用できるようにするという理念がpoolside Assistantの根底にある。

poolside Assistantの4つの特徴

 ワーナー氏はpoolside Assistantについて、主要な特徴を4つ解説した。

ドメイン特化モデル

 poolside Assistantは、汎用(はんよう)モデルではなくドメイン特化モデルを採用している。ワーナー氏は「当社のモデルは一般的なソースコード補完モデルと比較して約10倍の速さを誇る」と説明する。開発者が一連のプロセスを迅速に実行できる点は、同ツールの優れたユーザー体験(UX)を特徴づけるポイントになっている。

アクセスの容易性

 poolside AssistantはMicrosoftのソースコードエディタ「Visual Studio Code」(以下、VS Code)やJetBrainsの「WebStorm」など幅広いIDE(統合開発環境)に対応する他、Web上での利用が可能で、デバイスに依存せずアクセスできる。さらにpoolside Assistantの機能はAPI(アプリケーションプログラミングインタフェース)ベースで構築されており、既存のワークフローに組み込むことも容易だ。

コード実行フィードバックを用いた強化学習(RLCEF)

 poolside Assistantはモデルの学習に当たり、「コード実行フィードバックを用いた強化学習」(RLCEF:Reinforcement Learning from Code Execution Feedback)という独自の手法を採用している。モデルにコーディングの指示を与え、生成されたソースコードを実行環境で実際に動かし、その結果をフィードバックする仕組みだ。RLCEFでは、正解だけでなく間違った回答についても失敗の理由やパターンを学び、改善につなげる仕組みを持つ。失敗も学びの一環として活用することで、モデルはより効率的に学習を進めることができる。

 PoolsideはRLCEFの過程で得たフィードバックを、合成データとしてモデルのトレーニングに使用する。この仕組みにより、poolside Assistantではより多くのデータを用いたモデルの訓練が可能になる。ワーナー氏によると、インターネットには約20兆個の「トークン」(注1)が存在し、そのうち約3兆トークンはソースコードに関するものだ。Poolsideはこれに加えて、独自の合成データを用いることで他社との差異化を図っている。「モデルの精度を上げるため、顧客にデータを提供するよう求めるベンダーも存在するが、Poolsideではそうしたアプローチは取らない」とワーナー氏は強調する。

※注1:トークンとはテキストデータを処理する際の基本的な単位を指す。

データ安全性の確保

 企業におけるAIツール利用時の課題の一つが、社内データを外部に送信する際のリスクだ。「Poolsideは顧客のデータにアクセスしないことを保証しており、データは完全に顧客の管理下にある」とワーナー氏は説明する。

 一方で、AIツールからより高度なサポートを受けたい場合、ユーザーは広範なコンテキスト情報を提供する必要が出てくる。例えばAIツールにAPI作成を依頼する場合、「Slack」の会話履歴や「Jira」のチケット、その他の社内情報を組み合わせることで、モデルは最適な解答を導き出すことができる。これらの情報が不足していると、モデルから期待する回答を得られる可能性は下がってしまう。

 Poolsideは顧客データを取得しない代わりに、顧客自身が独自でモデルをトレーニングする「ファインチューニング」を実施する仕組みを提供する。顧客は自社データを外部に提供するリスクを回避しつつ、独自ユースケースやサードパーティー製アプリケーションとの統合を実現できる。

 加えて、Poolsideは「GPLv2」「GPLv3」といったウイルスライセンスを排除することで、ソフトウェアのライセンス条項が顧客データやコードベースに影響を及ぼさないようにしている。上記ライセンスが含まれたソフトウェアを利用すると、規約に則ってソースコードを公開する必要が出てくる可能性がある。特に大手金融機関や規制産業の企業にとって、このリスクは非常に重要な問題だ。Poolsideはデータのフィルタリングを徹底することで、リスクを完全に排除している。

5つのユースケース

 続けて、Poolsideのソリューションエンジニアリングを担当するビトー・モンテイロ氏が、デモを交えて主要なユースケースを5つ紹介した。

写真 poolside Assistantのデモ画面

プロジェクト立ち上げの支援

 ビトー氏は、「私はJavaエンジニアで、フロントエンド開発に不慣れなので、新しいプロジェクトを立ち上げるまでにかなりの時間がかかってしまいます」と話す。こうした課題を抱える開発者、特に経験が浅い開発者にとってpoolside Assistantは非常に有用なツールとなる。

 「このプロジェクトをローカルのiOSサーバ上でどう実行できるか」とビトー氏が質問を入力すると、poolside Assistantはプロジェクトに関するプログラミング言語、フレームワーク、依存関係ツリーを理解し、必要なインストール手順とコマンドを提示した。ビトー氏はそのコマンドを使用してプロジェクトを立ち上げ、ライブ環境で動作を確認することができたという。

ソースコード補完

 ビトー氏がコードエディタにソースコードの入力を始めると、poolside Assistantは瞬時に関連性の高いソースコード候補を提案し、タブキーを押すだけで自動補完された。低遅延で動作し、無線LAN(Wi-Fi)接続環境が不安定な場合でも迅速に候補を提示してくれる点も特徴だという。

リファクタリングの支援

 もしpoolside Assistantが提案したソースコードが気に入らない場合、「この条件式をswitch文(注2)にリファクタリングしてください」といった具合で依頼すると、代わりのソースコードを提示してくれる。生成したソースコードはチャットパネルで確認でき、コピーや修正が可能。「実装」ボタンをクリックすれば、自動で変更を適用し、プルリクエスト(変更内容を他の開発者に確認、承認してもらうプロセス)に似た形でレビューすることもできる。

※注2:switch文は、特定の変数や値に基づいて分岐処理を行うための構文で、条件が固定値の場合にコードをシンプルに整理するのに適する。

バグ修正の支援

 ビトー氏が「開発者の人数を小数(0.5など)で設定すると、最終的な値が0になってしまう」というバグを報告すると、poolside Assistantはバグの原因を特定すると同時に、「テキスト入力フィールドを数字のみに制限する方法」など具体的な修正方法を提案した。異なる解決方法を試したい場合は、「再生成」ボタンをクリックすると代替案を提示する。

UI構築の支援

 開発者がプロパティや要件を指定すると、poolside Assistantがアプリケーションのユーザーインタフェース(UI)を構築するためのソースコードを自動生成する。「ジョブリストがiPhoneのノッチ(画面上部の切り込み部分)に重ならないようにして」など、細かいレイアウトの要求にも対応可能だ。どのコンポーネントを使うか調べたり、手動で細かい調整をしたりする時間を節約できる。

Copyright © ITmedia, Inc. All Rights Reserved.

隴�スー騾ケツ€郢晏ク厥。郢ァ�、郢晏現�ス郢晢スシ郢昜サ」�ス

製品資料 グーグル・クラウド・ジャパン合同会社

約80%の企業でAIが定着していない? その理由と成功させるためのポイントとは

生成AIを活用して業務や顧客体験の再構築を進める動きが活性化しているが、その多くが、PoCやラボ環境の段階にとどまっている。なぜなら、生成AIの可能性を最大限に引き出すための、インフラのパフォーマンスが不十分だからだ。

市場調査・トレンド グーグル・クラウド・ジャパン合同会社

ソフトウェア開発ライフサイクルにおける、生成AI活用のポイントを考察する

昨今のソフトウェア開発では、AIコーディングアシスタントの活用が主流になっている。しかし、最適なコーディングアシストツールは、開発者や企業によって異なるという。導入の際は、どのようなポイントに注意すればよいのか。

製品資料 グーグル・クラウド・ジャパン合同会社

データベースをモダナイズし、生成AIを最大限に活用する方法とは?

生成AIの活用にはデータベースが重要となるが、従来のデータベースは最新テクノロジーに対応できないなどの課題がある。本資料では、データベースをモダナイズし、生成AIを用いてビジネスイノベーションを生み出すための方法を探る。

製品資料 グーグル・クラウド・ジャパン合同会社

検索体験と結果の質をどう高める? ユーザーに喜ばれる検索体験を実現する方法

ビジネスにおいて、検索体験およびその結果の質の向上が重要なテーマとなっている。顧客はもちろん、自社の従業員に対しても、実用的な答えをより迅速に、手間なく入手できる環境の整備が求められている。

事例 グーグル・クラウド・ジャパン合同会社

検索の効率化からデータ活用まで、生成AIの業務組み込み事例5選

登場以来ビジネスへの活用方法が模索されてきた生成AI。近年では業務組み込みにおける具体的な成功例が数多く報告されている。本資料では、5件の生成AI活用事例を交えて、業務に組み込む上での具体的なアプローチを解説する。

郢晏生ホヲ郢敖€郢晢スシ郢ァ�ウ郢晢スウ郢晢ソスホヲ郢晢ソスPR

From Informa TechTarget

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。

コード生成AI「Poolside」は一体何者? データを“集めない”独自戦略とは:AWS re:Invent 2024現地レポート - TechTargetジャパン エンタープライズAI 隴�スー騾ケツ€髫ェ蛟�スコ�ス

TechTarget郢ァ�ク郢晢ス」郢昜サ」ホヲ 隴�スー騾ケツ€髫ェ蛟�スコ�ス

ITmedia マーケティング新着記事

news025.png

「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。

news014.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news046.png

「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。