20世紀末から21世紀初頭にかけて、機械学習をはじめとするAI技術は急速な進化を遂げ、世間の関心を集めることとなった。現代の「AIブーム」の基盤がどのように築かれたのか、主要なブレイクスルーを解説する。
機械学習をはじめとする人工知能(AI)技術の発展において、1980年代から2000年代は重要な転換期となった。この期間に、ニューラルネットワークといった基礎理論が大きく進化し、世間の関心を集めるとともに、AI技術の実用化に向けた道筋が示された。現在の「AIブーム」の礎となる革新的な成果や出来事とは何か。時系列で振り返ってみよう。
コンピュータ科学者ジェラルド・ディヤング氏が「EBL」(Explanation Based Learning:説明に基づく学習)を提唱した。EBLは、コンピュータがデータを学び、新しい知識や概念を習得する機械学習手法だ。データをそのまま覚えるのではなく、なぜそのデータが重要なのかを理解し、重要な部分のみを学習する点が大きな特徴だった。
コンピュータ科学者テリー・セジノウスキー氏が、英語テキストを音声表現に変換するためのニューラルネットワーク「NETtalk」を開発した。NETtalkは、書かれた単語とその発音を含む訓練データを処理することで、英語のつづりから音声への変換規則を効果的にモデル化したものだ。人間の学習と類似した方法で、読み上げなどのタスクを学習するニューラルネットワークの可能性を示した。
コンピュータ科学者のヤン・ルカン氏とヨシュア・ベンジオ氏らが、深層学習モデル「CNN」(Convolutional Neural Network:畳み込みニューラルネットワーク)を使って手書き文字を認識する方法を示した。これにより、ニューラルネットワークが実世界の問題に適用できる可能性を示した。
クリストファー・ワトキンズ氏が「Q学習」を開発した。これは、AIモデルが最善のアクションを取るための方法を教える強化学習手法だ。Q学習では行動価値関数(Q関数)を更新して学習を進める。ゲームで例えると、ある状態で、ある行動を取った場合に、どれだけ勝利に近づくかを示す。
Axcelisがソフトウェア「Evolver」を発売した。遺伝的アルゴリズムを使った一般PC向けの商業用ソフトウェアとして世界初とされる。遺伝的アルゴリズムは、自然界の進化の仕組みを模倣した方法だ。問題を解決するための最適な解を見つけるために「選択」「交配」「突然変異」といったプロセスを用いる。当時、アルゴリズムは主に研究者や専門家が使うものだった。Evolverの登場により、一般のPCでも複雑な問題を解く方法を簡単に試すことができるようになった。
IBMの研究者ジェラルド・テサウロ氏は「TD-Gammon」を開発した。人工ニューラルネットワーク(ANN:Artificial Neural Network)に基づいてチェスやボードゲーム「Backgammon」をプレイするプログラムだ。強化学習により最適な手法を導き出すことができた。当時の世界チャンピオンや上級プレイヤーとしのぎを削った。
コンピュータ科学者ゼップ・ホッフライター氏とコンピュータ科学者ユルゲン・シュミットフーバー氏は、「長・短期記憶」(LSTM:Long Short Term Memory)を提唱した。これはニューラルネットワークの一種だ。長期間の情報を保持し、文章や音声など、時間的な順序に依存するタスクを効果的に処理できる。コンピュータが人間の言葉や映像の流れを理解し、処理する上で役に立つ。
IBMが開発したチェス専用のスーパーコンピュータ「Deep Blue」が、チェス選手のガルリ・カスパロフ氏と対戦して勝利を収めた。コンピュータが正式なチェス大会で世界チャンピオンに勝利した事例としては初とされ、AIの歴史において重要な瞬間となった。
畳み込みニューラルネットワークを開発したルカン氏の率いるチームが、データセット「Modified National Institute of Standards and Technology」(MNIST)を発表した。このデータセットは、コンピュータが手書きの数字を認識する技術を評価するための標準的なベンチマークとなり、特にディープラーニング(深層学習)など最新技術をテストする際に重要な役割を果たした。新しいアルゴリズムを試すための簡単でアクセスしやすい方法を提供し、手書き文字認識技術の発展に貢献した。
世界初とされるオープンソースの機械学習ライブラリ「Torch」が公開された。Torchの深層学習アルゴリズムはプログラミング言語「C」で実装されており、そのアルゴリズムを簡単に操作できるインタフェースを提供した。これにより、研究者は深層学習技術に容易にアクセスし、新しいモデルを作ったりテストしたりできるようになった。後に、「PyTorch」といったAIフレームワークの基礎となった。
モントリオール大学の研究者たちは論文「A Neural Probabilistic Language Model」を発表した。この論文では、順伝播型ニューラルネットワーク(FNN:Feed-forward Neural Network)を用いて言語をモデル化する(言葉の並びや意味をコンピュータが理解できるようにする)方法を提案した。これまでの言語処理では統計的手法が使われていたが、ニューラルネットワークを用いたより自然で柔軟な方法を示した。
心理学者でコンピュータ科学者でもあるジェフリー・ヒントン氏が、深層信念ネットワーク(DBN:Deep Belief Network)を提唱した。深層ニューラルネットワークは訓練が難しく、それまでほとんど使われていなかった。ヒントン氏のアプローチにより、深層ネットワークを効率的に訓練する方法が見つかり、その後のディープラーニング技術活用の基礎を築いた。その業績が称えられ、ヒントン氏は2024年にノーベル物理学賞を受賞した。
コンピュータ科学者フェイ・フェイ・リー氏は、画像データベース「ImageNet」の開発に取り組み始めた。ImageNetでは何百万枚もの画像が分類されており、AIモデルの物体認識能力を訓練するために使われた。ImageNetは2009年に一般提供され、 AIブームの火付け役となった。
動画配信サービスを手掛けるNetflixは、同社主催のアルゴリズムコンテスト「Netflix Prize」を開催した。コンテストの目的は、Netflixが当時採用していたユーザーレコメンデーションシステムよりも精度の高い機械学習アルゴリズムを作成することだった。コンテストには数々の研究者が参加し、ユーザーレコメンデーションシステムの発展を促した。
IBMのAIシステム「IBM Watson」が誕生した。IBM Watsonは、もともとクイズ番組「Jeopardy!」(ジョパディ!)に出場して人間に勝つことを目標として開発された。
Microsoftは、同社ゲーム機「Xbox 360」向けに、という動きを感知するモーションセンサーデバイス「Kinect」を発売した。Kinectは、カメラやセンサーを用いて身体の20カ所(手足や頭など)を追跡し、それを1秒間に30回検出する。これにより、コントローラーを使わずに、身体を動かしてゲームをプレイできるようになった。
アンソニー・ゴールドブルーム氏とベン・ハマー氏が機械学習のコンテストプラットフォーム「Kaggle」を立ち上げた。Kaggleでは、企業や研究機関が課題を投稿し、参加者がその課題を解くためのアルゴリズムを開発して競い合う。例えば、ある企業が「AIで売り上げを予測する」といった課題を出すと、データサイエンティストが解決方法を競い合って考える。
1997年にLSTMを提唱したシュミットフーバー氏や、幾何学的深層学習のパイオニアとみられるジョナサン・マッシ氏などのチームは、交通標識認識コンテスト「German Traffic Sign Recognition Benchmark」で優勝した。具体的には、畳み込みニューラルネットワークを用いて交通標識を正確に認識するAIモデルを開発。その正確さが人間の識別能力を上回ったとして大きな関心を集めた。この技術は、今日の自動運転車や画像認識技術の基礎となっている。
IBM WatsonがJeopardy!で、当時の最高連勝記録の保持者だったケン・ジェニングス氏に勝利した。
ヒントン氏の他、コンピュータ科学者イリア・スーツキヴァー氏、コンピュータ科学者アレックス・クリジェフスキー氏が「深層畳み込みニューラルネットワーク」(DCNN:Deep CNN)アーキテクチャを提唱して、ImageNetを用いた画像認識コンテスト「ImageNet Large Scale Visual Recognition Challenge」(ILSVRC)で優勝した。DCNNはそれまでのAI技術よりも正確に画像を分類でき、深層学習の研究や応用が一気に広がるきっかけとなった。
次回は、2013年から2024年現在に至るまでのAI分野の歴史を振り返る。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。
Omnicomが Interpublic Groupを買収 世界最大級の広告会社が誕生へ
OmnicomがInterpublic Group(IPG)を買収する。これにより、世界最大の広告会社が誕生し...
インテントデータ×キーエンス出身者のノウハウで実現 ABMを先に進める最先端の営業手法とは?
ユーソナーとGrand Centralは提携し、営業売り上げ拡大のためのBPOパッケージを提供開始...
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2024年12月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...