1930年代から始まった人工知能(AI)技術の歴史はどのように変遷したのか。2015年から2018年に焦点を当てて、その変化を紹介する。
2022年11月にAI(人工知能)チャットbot「ChatGPT」が登場し、業務や日常生活のさまざまな場面に変革をもたらした。今日のAI技術は、どのような技術に支えらえてきたのか。本稿では、2015年から2018年のAI技術の変遷について紹介する。
CAD(コンピュータ支援設計)ソフトウェアベンダーAutodeskの研究チームが、ジェネレーティブデザイン(パラメーターに基づいて複数のデザイン案を自動で生成する機械学習の手法)を活用できるCADツール「Project Dreamcatcher」に関する研究を発表した。ユーザーが材料、サイズ、重量などを入力すると、アルゴリズムを使ってデザイン案を生成する。
スタンフォード大学(Stanford University)の研究者らが、深層学習モデルの一つ、「拡散モデル」(Diffusion Model)に関する論文「Deep Unsupervised Learning using Nonequilibrium Thermodynamics」を発表した。画像にノイズ(誤ったデータ)を加えるプロセスと、ノイズだけの状態から元の画像を再構成する手法を提案した。このアプローチは、画像や動画の合成、テキスト生成、言語モデルの構築に応用されている。
Microsoftが、短文投稿サービス「Twitter」(現「X」)上で一般ユーザーとの対話を通じて学習するAIチャットbot「TAY:thinking about you」を公開した。しかし、一部のユーザーが挑発的な投稿を繰り返したことで、TAYは人種差別や性的な内容を含む発言を生成するようになり、公開からわずか16時間でサービスの運用が停止された。
Googleが、AI関連のタスクで大量の演算処理を並列処理する独自プロセッサ「TPU」(Tensor Processing Unit)の設計にAIを使用していると発表した。
Googleの研究者らが、論文「Attention is all you need」で深層学習モデル「Transformer」の概念を提唱した。Transformerは、機械学習手法「アテンションメカニズム」を使って、重要な情報を効率的に見つけることができる。同論文は、ラベルのないテキストを自動的に大規模言語モデル(LLM)で解析するためのツール開発を促進した。
ドイツの電機メーカーSiemensがソフトウェアベンダーFrustum(2018年11月にソフトウェアベンダーPTCが買収)と提携し、Siemensの製品設計開発システム「NX」にジェネレーティブデザイン技術を統合した。
Autodeskが、Project Dreamcatcherの研究を実用化したCADツール「Autodesk Generative Design」を発表した。
Googleの研究者らが、Transformerを実装した大規模言語モデル(LLM)「BERT」(Bidirectional Encoder Representations from Transformers)を開発した。BERTは33億単語以上を学習し、標準的なモデルで1億1000万のパラメーター(モデルのトレーニングに使う変数)を持つ。文章、段落、書籍における単語間の関係を自動的に学習してテキストの意味を予測できる。
AI研究開発機関「Google DeepMind」の研究者らが、タンパク質の構造を予測するAIプログラム「AlphaFold」を開発した。これは、医学研究、創薬、化学分野における生成AI応用の基礎を築いたとされる。2024年には、AlphaFoldの開発者であるデミス・ハサビス氏とジョン・ジャンパー氏、タンパク質の構造予測ツール「Rosetta」を開発したデビッド・ベーカー氏がノーベル化学賞を受賞した。
マラリア撲滅に取り組む慈善団体Malaria No Moreと元サッカー選手のデビッド・ベッカム氏は、マラリアの撲滅を訴える世界的なキャンペーンにおいて9カ国語でスピーチを読み上げる動画を公開した。この動画はAI技術を用いて本人が実際に話していない言語でも自然に発話しているように見せる「ディープフェイク」を使って作成された。
イギリスのエネルギー企業のCEOが、ディープフェイクによる偽の音声を親会社のCEOの声と誤認し、指示通りにハンガリーの銀行へ22万ユーロ(約3588万円)を送金した。この事件をきっかけに、世界はソーシャルエンジニアリングを用いた新たなサイバー攻撃の脅威に警戒を強めることとなった。
OpenAIは15億のパラメーターを持つ言語モデル、「GPT-2」を公開した。800万のWebページのデータセットを学習しており、入力された単語から次に続く単語を逐次予測することで人間が書いたような自然な文章を生成できた。
OpenAIは1750億のパラメーターを持ち、800ギガバイトの保存容量を必要とするニューラルネットワーク(人の脳の神経細胞をモデル化した情報処理システム)を用いた言語モデル「GPT-3」を公開した。OpenAIによると、2020年5月に公開されてから9カ月間で、300以上のアプリケーションがGPT-3を使用し、数千人の開発者がプラットフォーム上で開発を推進した。
Google、カリフォルニア大学バークレー校(University of California, Berkeley)、カリフォルニア大学サンディエゴ校(University California San Diego)の研究者らが論文「NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis」を発表した。機械学習とニューラルネットワークを使って2D(2次元)や3D(3次元)のコンテンツを生成する「NeRF」(Neural Radiance Fields)に関する研究として、イノベーションの活性化に貢献した。
Microsoftの研究者らは、キャプションデータなしで画像キャプション生成アルゴリズムを事前学習させる手法「VIsual Vocabulary」(VIVO)を開発した。テストでは多くの人間によるキャプション付けを上回る性能を示したという。
OpenAIはプロンプト(AIへの指示)から画像を生成できるAIモデル「Dall-E」を発表した。芸術家サルバドール・ダリや、架空のロボットの名称にちなんでいるという説もある。Dall-Eは、インターネット上の画像のキャプションをランク付けするCLIP(Contrastive Language-Image Pre-training)の概念を導入した。
TechTarget.AI編集部は生成AIなどのサービスを利用し、米国Informa TechTargetの記事を翻訳して国内向けにお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
本記事は制作段階でChatGPT等の生成系AIサービスを利用していますが、文責は編集部に帰属します。
ドキュメントから「価値」を引き出す、Acrobat AIアシスタント活用術 (2025/3/28)
広がるIBM i の可能性 生成AIによる基幹システム活用の新たな技術的アプローチ (2025/3/28)
「NVIDIAのGPUは高過ぎる……」と諦める必要はない? GPU調達はこう変わる (2025/3/11)
PoCで終わらせない企業の生成AI活用 有識者が語る、失敗を避けるためのノウハウ (2024/10/18)
生成AIのビジネス利用 すぐに、安全に使うためには? (2024/8/26)
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...
「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。