「ChatGPT」や「Dall-E」などのAIサービスやAIモデルの開発を手掛けるOpenAIとはどのような企業なのか。同社の歴史や事業内容、抱えている課題を詳しく説明する。
OpenAIは、人類全体に利益をもたらす汎用人工知能(AGI)を開発することを目指す非営利法人だ。同法人は、営利目的のOpenAIやOpenAI Globalといった会社を複数社保有している。非営利法人のOpenAIはイーロン・マスク氏やサム・アルトマン氏らによって2015年に設立され、サンフランシスコに本部を構えている。
OpenAIの創業者たちがAGIの欠陥や誤用から生じる事故のリスクに懸念を抱いていたことから、同法人は設立された。創業者と他の投資家たちは、10億ドルの寄付金で法人を設立した。マスク氏は自身がCEOを務める自動車会社Teslaの事業とOpenAIが利益相反する可能性が生じたことから、2018年2月に会社を離脱した。
OpenAIは設立当初、ビデオゲームやその他の娯楽のためのAIモデルの開発を主要な事業としていた。2016年4月には、最初のAIサービスである強化学習(RL:Reinforcement Learning)アルゴリズムの開発用ライブラリ「OpenAI Gym」のベータ版を発表した。その後の2年間で、OpenAIはより汎用的な用途に利用できるAIモデルとAIツールの開発や研究に集中した。
2018年にOpenAIは、「GPT」(Generative Pre-trained Transformer)とは何かを世界に説明する報告書を発表した。GPTは、人間の脳のように機能するように設計されたLLM(大規模言語モデル)で、大規模な学習用データセットに基づいて、ユーザーの質問への回答を生成する。
2019年3月に、OpenAIは営利法人としてのOpenAIを設立した(会社形態では親会社がOpenAI Inc.、営利目的の子会社がOpenAI LP)。2021年1月にOpenAIは画像生成AIモデルの「Dall-E」を発表した。Dall-Eはユーザーが自然言語で入力したテキストの内容に基づいて画像を生成する。
OpenAIの代表的なサービスとして、同社が2022年11月に公開したチャットbotサービス「ChatGPT」が挙げられる。同サービスは、ほぼ無限に近い範囲の話題に対してユーザーに回答を提供する能力を持つ。
OpenAIは主に以下の製品やサービス、技術を提供している。
GPT-3は、他のOpenAIサービスの基盤になっているLLMだ。人間が生成したテキストを学習して、類似するテキストを生成する。
Dall-Eとその後継バージョンの「Dall-E 2」「Dall-E 3」は、画像生成AIモデルと、同モデルを組み込んだWebサービスを指す。ユーザーが指示や説明をテキストで入力すると、そのテキスト通りに画像を生成する。
「CLIP」(Contrastive Language-Image Pre-training)は、特定の画像に対して関連性があるテキストを付与する画像分類のためのニューラルネットワークだ。CLIPは画像の内容を正確に説明するキャプションを予測できる。画像とテキストという両方の形式のデータから学習する能力を持つため、「マルチモーダルAI」(複数種類のデータを組み合わせて処理できるAIモデル)の一例と言える。
「ChatGPT」は人間のようなテキストを生成し、ユーザーの質問に答えを出すように設計されたAIチャットbotサービスだ。大規模なデータセットで訓練されているため、人間と同じように答えや反応を生成できる。同サービスはOpenAIが継続的にアップデートしている。公開当初はテキストによる入出力機能しか備えていなかったが、音声や画像を使ってユーザーとやりとりできるようになった。
「OpenAI Codex」は自然言語からソースコードを生成するAIモデルだ。ソフトウェア開発者がコーディング作業を簡素化することを助けるために開発された。CodexはGPT-3の技術に基づいており、さまざまなプログラミング言語の十億行以上のソースコードを学習データにして訓練している。
「Whisper」は自動音声認識(ASR)のためのAIモデルだ。Whisperは約100種類の異なる言語で、専門用語を含めたさまざまなアクセントの音声を認識できるようにするために、大量の音声データで訓練されている。ユーザーはWhisperを音声の文字起こしや翻訳などに利用できる。
2023年1月、MicrosoftはOpenAIに対する数十億ドル規模の投資を約束した。同社がOpenAIに関心を持ち始めたのは今回が初めてではない。2019年7月に、OpenAIはMicrosoftと複数年にわたるパートナーシップを結んでいる。Microsoftのクラウドサービス群「Microsoft Azure」のサービスの一つで、2021年に発表された「Azure OpenAI Services」では、OpenAI製のAIモデルの利用が可能だ。
MicrosoftとOpenAIの提携は、Microsoftの検索エンジン「Bing」にまで拡大している。MicrosoftはChatGPTの技術を活用して、OpenAIのAIモデル「GPT-4」を組み込んだバージョンのBingを開発している。Webブラウザ「Edge」やメールクライアント「Microsoft Outlook」、コラボレーションツール「Microsoft Teams」といったMicrosoft製品でも生成AI機能が利用できる。
OpenAIは事業方針やAI倫理に関する批判を受けている。2019年に同法人が非営利法人から「上限利益型」(capped-profit)の法人に移行したことは、AI技術の開発において公益よりも市場での利益や競争力を追求する方針に変わったのではないかという批判を招いた。OpenAIはオープンソースAIソフトウェアの開発を進めているにもかかわらず、詳細な技術情報やソースコードを非公開にしており、透明性が欠如しているという批判もある。
ChatGPTは仕様に幾つかの問題を抱えている。同アプリケーションはしばしば、事実と異なる情報を生成する現象を指す「ハルシネーション」(幻覚)を起こす。ChatGPTの回答は一見知的でよく書かれているように見えても、その内容が間違っていることがある。
最新のニュースや出来事に対する回答ができないことも欠点の一つだ。「GPT-3.5」の訓練に使っている学習データセットは2021年9月までのデータであるため、ユーザーは最新の情報が得られないことがある。OpenAIは2023年11月に有償サービスの「ChatGPT Plus」とGPTの新バージョン「GPT-4」を発表し、2023年4月までの情報を回答に含められるようにした。
ChatGPTは安全性に関する問題も抱えている。同サービスには人類にとって有害な回答(爆弾の作り方や個人情報の盗み方、詐欺の方法など)を出力することを防ぐために、セーフガード機構が設けられている。研究者たちは、こうしたセーフガードを無効にする「ジェイルブレーク」(脱獄)と呼ばれる命令文を定期的に発見している。
各国の政府はOpenAIのAI技術に対する監視を強めている。イタリア政府は2023年3月、OpenAIのユーザーデータ利用時の透明性が欠如しているとして、国内でのChatGPTの利用を一時的に禁止した。フランス政府は、ChatGPTの使用が引き起こすリスクの調査を進めている。米国のホワイトハウスは、AI技術のリスクに関するさらなる情報をOpenAIに求めている。
ChatGPTが学習データを盗用している可能性も指摘されている。2023年6月に、カリフォルニア州のジョセフ・サヴェリ法律事務所(Joseph Saveri Law Firm)は、5人の作家からなる原告団を代表して訴訟を起こした。原告団は、ChatGPTと同サービスに組み込まれた大規模言語モデル(LLM)のGPT-3.5とGPT-4が、著作権で保護された作品を無断で使用して要約し、LLMの訓練に使用したと主張している。
米紙The New York Timesは2023年12月にOpenAIとMicrosoftを著作権侵害で提訴した。同社はOpenAIが自社の記事を無断で複製して、LLMやAIサービスの開発に利用したと批判している。
OpenAIはAIの倫理性の改善に取り組んでいる。ChatGPTに対する懐疑を解消するために、OpenAIは2023年8月にChatGPTの企業向けエディション「ChatGPT Enterprise」を発表した。同サービスはユーザーの入出力したデータや使用状況などをAIモデルの学習データとして利用しないことを約束している。しかし同社のAIモデルの学習データの透明性は依然として不十分で、全ての学習データが著作権を侵害していない素材かどうかは不明だ。
OpenAIは取締役会の代表者の多様性の欠如が「全人類に利益をもたらす」という会社の使命に合致していないという批判も受けている。2023年11月にアルトマン氏が解雇されてから再雇用された後、OpenAIは唯一の女性取締役2人を解任し、白人男性のみで構成された取締役会を再編した。米国の連邦議会議員らは、再編後のOpenAIに対して取締役会の多様化を勧告した。
共同創始者であるアルトマン氏は、金融SaaS企業Stripeの元CTOであるグレッグ・ブロックマン氏と元Googleのチーフサイエンティストであるイリヤ・サツケバー氏と共に、2023年11月まで同社のCEOを務めた。
2023年11月17日、アルトマン氏は「役員会に対する誠実さの欠如」を理由に解雇された。その後すぐにブロックマン氏も会社を離れた。両者は会社を離れた3日後に、Microsoftに雇われた。
アルトマン氏の退任後、ライブ配信サービスTwitchの共同創設者であるエメット・シア氏が、OpenAIの暫定CEOに就任した。アルトマンの解任後、OpenAIの従業員約500人が、役員会が退任しない場合は辞職すると表明した。解任から5日後の2023年11月22日、アルトマン氏とブロックマン氏は新しい役員会と共に元の役職に復帰すると発表した
Copyright © ITmedia, Inc. All Rights Reserved.
なぜ料理の失敗写真がパッケージに? クノールが展開する「ジレニアル世代」向けキャンペーンの真意
調味料ブランドのKnorr(クノール)は季節限定のホリデーマーケティングキャンペーン「#E...
業界トップランナーが語る「イベントDX」 リアルもオンラインも、もっと変われる
コロナ禍を経て、イベントの在り方は大きく変わった。データを駆使してイベントの体験価...
SEOを強化するサイトの9割超が表示速度を重視 で、対策にいくら投資している?
Reproが「Webサイトの表示速度改善についての実態調査 2024」レポートを公開。表示速度改...