画像生成AIで裁判沙汰も 2022年からAIの歴史はこう変わった一気におさらい AIはじめて物語【第4回】

2022年11月に「ChatGPT」が公開された。ChatGPTはさまざまな人工知能(AI)技術を礎としている。他にはどのような技術が登場したのか。その歴史をおさらいする。

2025年05月11日 06時00分 公開
[George LawtonTechTarget]

関連キーワード

人工知能


 AI(人工知能)技術は社会のさまざまな分野で革新をもたらしている。AIチャットbot「ChatGPT」が登場した2022年は、他にも特筆すべきさまざまなAI技術が従来型の業務手法に影響を与えた。

2022年以降、AI技術はどう変化した?

会員登録(無料)が必要です

2022年(画像生成AI、マルチモーダルAI、AIチャットbot)

 OpenAIは、2021年に発表したAIモデル「Dall-E」よりもより少ないメモリや処理能力で動作する画像生成AIモデル「Dall-E 2」を発表した。

 NVIDIAは写真などの2D(2次元)画像を素早く3D(3次元)画像やコンテンツに変換する技術「NGP Instant NeRF」を開発した。

 AI研究開発機関Google DeepMindは、汎用(はんよう)マルチモーダルAI「Gato」に関する論文を発表した。それによると、同AIはテキストのキャプション付け、ロボットへの指示生成、ビデオゲームのプレイ、環境内のナビゲーションなど、600以上のタスクを実行できる。

 クリエイター向けAIツールを提供するRunway AI、画像生成AIサービスを開発するStability AI、ミュンヘン大学(Ludwig-Maximilians-Universitaet Muenchen)のComputer Vision & Learning research group の研究者らは、入力したテキスト(プロンプト)から自動的に画像を生成できる「Stable Diffusion」をオープンソース化した。オートエンコーダでデータを圧縮し、その中間形式を拡散モデルが利用することで、データの生成や処理を効率化し、より少ないメモリや処理能力で高品質な画像やコンテンツを生成できる。

 OpenAIは11月、ChatGPTを公開した。同社の大規模言語モデル(LLM)「GPT 3.5」を使ったチャットベースのインターフェースだ。公開から2カ月間で1億人以上のユーザーを獲得した。

2023年(AIチャットbot、マルチモーダルAI、NeRF)

 画像サービスを提供するGetty Imagesは複数のアーティストらとともに、Stable Diffusionを実装した複数の企業を著作権侵害で提訴した。Stability AI、Midjourney、DeviantArtなどが同意なくGetty Imagesのコンテンツをスクレイピング(Webサイトからデータを収集して使いやすく加工すること)したと主張した。

 Microsoftは同社の検索エンジン「Bing」をChatGPTに統合したと発表した。Googleはその動きに追随し、LLMである「LaMDA」(Language Model for Dialogue Applications)を基盤としたAIチャットbot「Bard」をリリースする計画を発表した。

 OpenAIは、テキストや音声などの数種類のデータを組み合わせて処理できるAI技術「GPT-4」を公開した。これを受け、米国の非営利団体Future of Life Instituteは、GPT-4を上回る能力を持つAIシステムの開発や運用を少なくとも半年間停止するよう求める署名活動を実施し、実業家のイーロン・マスク氏やAppleの共同設立者スティーブ・ウォズニアック氏ら約3万3700人が署名した。

 フランスとドイツの研究チームは 3D画像生成技術「NeRF」(Neural Radiance Fields)の技術を改良し、データをガウス分布で表現する新しい方法を開発した。これにより、より迅速かつ効率的な3D画像の生成や表示が可能となった。

 OpenAIの取締役会はCEOのサム・アルトマンを、社内コミュニケーションにおいて一貫性を欠いていたことを理由に解任したが、従業員らの反発もあり、最終的にはCEOに復帰した。

 Googleは、AIチャットbotや、テキスト、画像、音声生成、エンタープライズ向けおよびコンシューマー向けAIサービスを統合したブランドとして、生成AIモデル「Gemini」(旧Bard)を公開した。

2024年(AIエージェント、Embodied AI、オープンソースLLM、動画生成AI)

 Salesforceが、同社のCRM(顧客関係管理)システム「Salesforce」においてAIエージェント機能「Agentforce」の提供を開始した。Microsoft、Workday、Oracle、ServiceNowなど他の主要エンタープライズベンダーも独自のエージェント型AIインフラの構築に乗り出した。しかし、これらプラットフォーム間での相互連携は進んでいない。

 「Embodied AI」は、AI技術をロボットや自動運転車などに組み込むことで、現実世界と相互作用しながら学習するAIだ。文章や単語からパターンを理解して学習するLLMと比べ、Embodied AIは「ロボットが荷物を持ち上げる」「自動運転車が道路を走行する」といった現実世界における動きやそのシミュレーションから学習する。Embodied AIは以下の技術で構成されている。

  • 大規模アクションモデル(LAM:Large Action Model)
    • 人間の意図を理解し、業務や意思決定を自動遂行できるモデル
  • 大規模行動モデル(LBM:Large Behavior Models)
    • 人間の行動パターンを学習し、予測するモデル
  • 世界基盤モデル(WFM:World Foundation Models)
    • 現実世界の環境を再現し、テキスト、画像、動画の入力に基づいて結果を予測する技術

 欧州連合(EU)は、2024年8月に欧州でのAIモデルの利用を制限する法律「AI法」(Artificial Intelligence Act)を施行した。オープンソースのAIシステムには特別条項が設けられた。米政府は、一部の国々へのAIチップ販売を制限する輸出規制を導入した。

 AIチップを開発するCerebras Systemsは、4兆のトランジスタと90万のAI最適化コアを持つウェハースケールAIチップ「WSE-3」を発表。個別のGPUを使用する場合と比べて、多くの生成AIのトレーニングと推論プロセスを10~20倍高速に実行できると同社は主張している。

 中国のAIスタートアップDeepSeekがLLM「DeepSeek V3」を発表した。DeepSeekは、中国の投資会社High-Flyerの支援を受けている。DeepSeek V3は、OpenAIの最新モデルに匹敵する性能を低コストで実現したとされている。V3はオープンソースとして公開されているため、OpenAIやAnthropicなどが提供する独自モデルのメリットと、モデルの仕組みや潜在的な課題を可視化できるオープンソースのメリットを比較検討する動きが広がっている。

 OpenAIはユーザーのプロンプトに基づいて短い動画を生成する動画生成AI「Sora」を発表。初期のデモでは、山道を走る車、短いアニメーション、シミュレーションされた都市を歩く人々など、リアルな動画を生成できることを示した。SoraはOpenAIのChatGPTサービスのアドオン(拡張機能)としてリリースされ、短い動画の生成が可能になったが、それによってアーティスト、俳優、作家などクリエイティブ業界における将来への懸念が高まっている。

 イーロン・マスク氏が創業したAI技術の会社「xAI」は、米テネシー州に10万台の高性能GPU「NVIDIA H100」を接続した大規模AIスーパーコンピュータを構築した。マスク氏は「史上最大のスーパーコンピュータ」と主張している。建設期間は最短19日、最長でも122日と推定されており、大規模AIインフラとしては最速クラスの構築例とされている。

TechTarget.AIとは

TechTarget.AI編集部は生成AIなどのサービスを利用し、米国Informa TechTargetの記事を翻訳して国内向けにお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.
本記事は制作段階でChatGPT等の生成系AIサービスを利用していますが、文責は編集部に帰属します。

新着ホワイトペーパー

製品レビュー ストックマーク株式会社

AI技術を使って必要な情報を自動で抽出/要約する「情報収集サービス」の実力

日々情報が増え続ける今、業務に必要な全ての情報を、社内外の関連ニュースや論文、特許情報などから収集していくのは至難の業だ。そこで業務に必要な情報を着実に届けるための仕組み作りに役立つサービスを紹介する。

製品資料 ゼットスケーラー株式会社

セキュリティリーダー必見:データセキュリティの複雑化によるリスクの解消方法             

クラウド利用の拡大に伴い、データが分散・肥大化する中、従来のセキュリティ対策の限界が見え始めている。データの所在や利用状況を可視化し、リスクを事前に把握して対応することが求められる今、有効となる新たなアプローチを探る。

市場調査・トレンド ゼットスケーラー株式会社

AI/MLトランザクション分析から読み取る、企業のリスク管理とセキュリティ課題

AIの活用が急速に進む一方で、セキュリティリスクの増大が懸念され、企業の対応が急務となっている。本資料では、2024年2~12月までの5365億件のAI/ML(機械学習)トランザクションの分析に基づき、その実態と対策を多角的に考察する。

事例 富士通株式会社

富士通が実践、AI時代に最適な設計プロセスを実現する方法

製造業の設計現場では、設計プロセスの複雑化などの課題が山積している。こうした中、注目を集めているのが生成AIの活用だ。本資料では、生成AIがもたらす設計業務の未来について、詳しく解説する。

製品資料 富士通株式会社

チャットbotだけで終わらせない、生成AIの“高度な活用”を実現するには?

多くの企業が業務における生成AIの有用性を実感する一方、高度な活用を目指すに当たり、壁に突き当たっているケースは多い。既存の業務やシステムと生成AIをスムーズに組み合わせ、自社に合った形で活用するには、どうすればよいのか。

From Informa TechTarget

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。

ITmedia マーケティング新着記事

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...

news025.png

「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。