大規模言語モデル(LLM)は、人工知能(AI)モデルの一種だ。ディープラーニング(深層学習)技術と大規模なデータセットを用いて、新しいコンテンツの生成や要約をしたり、次に起こることを予測したりする。(続きはページの末尾にあります)
OpenAIが「GPT-5」を発表した。CEOのサム・アルトマン氏は、GPT-5について「汎用人工知能(AGI)への重要な一歩」と述べたが、果たしてそれは真実なのか。GPT-5の特徴と利用方法、業界の反応を紹介する。
AI導入で行き詰まる企業が相次ぐ中、Googleの「Gemini 2.5 Flash-Lite」モデルは「軽量・低コスト」という新たな解を提示する。軽量AIに寄せられる期待とは。
Googleは、「Gemini」をCLIから直接操作できるツールとして、開発者向けのオープンソースAIエージェント「Gemini CLI」のプレビュー版を公開した。どのようなタスクに活用できるのか。
LLMの性能を評価したい場合、どのベンチマークを使えばいいのか。ベンチマークごとに得意分野はあるのか。LLM選定の鍵となる、主要なベンチマークとその特徴を紹介する。
過熱するAI市場で、IBMは独自のオープンソースAIモデル「Granite」の強化に取り組んでいる。企業が業務に利用する際に役立つ特徴や機能を備えるという、その概要とは。
2024年12月、OpenAIは新プラン「ChatGPT Pro」を発表した。まず目を引くのが、月額200ドル(約3万円)という強気な価格設定だ。OpenAIの狙いと、AI市場に与える影響とは。
Microsoftが小規模言語モデル(SLM)「Phi-3」ファミリーを基にした、業界特化型のAIモデルを提供している。金融や製造業ではどのような用途を見込むのか。
「OpenAI o1」は、2024年9月にOpenAIが発表したLLM新モデルだ。モデルの実力や、安全面の取り組みと併せて、OpenAI o1を利用する方法を紹介する。
Alibabaは、東南アジアのさまざまな言語を処理できる新しいLLM「SeaLLM」の提供を開始した。
生成AI(ジェネレーティブAI)技術は、LLMと密接な関係がある。LLMはテキストベースのコンテンツを生成するために特別に設計されたジェネレーティブAIの一種だからだ。
言語は、あらゆるコミュニケーションの中核となる概念だ。人間が事実や自分の考えを他人に伝えるために、言葉や文法は不可欠だ。AIシステムでも、言語モデルが同様の役割を果たす。言語モデルはAIシステムが新しい言葉を生み出すための仕組みとなる。
言語モデルのルーツは、1966年にさかのぼる。1966年にマサチューセッツ工科大学(MIT)で完成した「ELIZA」は、言語モデルの最初期の例だ。
現代の言語モデルを利用可能にするにはまず、学習データ群を言語モデルに取り込む。次に、取り込んだ学習データから言葉同士の関連性やパターンを推測できるようにする。その後、学習されたデータに基づいて新しい文章や画像といったコンテンツを生成できるようにする。
言語モデルは一般的に、ユーザーが自然言語で命令を入力して結果を生成するAIアプリケーションで使用される。LLMは、AIにおける言語モデルが進化した概念だ。トレーニングと推論に使用するためにより多くの学習データを使用することで、AIモデルの能力が大幅に向上する。
AI技術が成長し続けるにつれ、ビジネスでAI技術を活用することはますます重要になる。機械学習モデルを作成し、ビジネスに適用するプロセスでは、単純さと一貫性を維持することがポイントになる。解決しなければならない課題を明確にすることも、機械学習モデルの正確さを確保することと同様に不可欠だ。
LLMの学習は、複数のステップを踏む。LLMはまず、コーパス(AIモデルが分析可能な形式に構造化された自然言語のデータ)を参照しながら、PB(ペタバイト)規模の学習データで学習する。この際、通常は教師なし学習(例題とその答えを組み合わせた「教師データ」を利用しない学習手法)を用いる。教師なし学習には、構造化されていないデータ とラベル付けされていないデータを利用する。ラベル付けされていないデータでトレーニングすることの利点の一つは、利用可能なデータを用意する負荷を軽減できることだ。この段階で、モデルは異なる単語や概念同士を関係付けられるようになる。
次の学習ステップは、自己教師あり学習(前のステップでトレーニングしたLLMを新しい学習データで再学習させる手法)によるLLMの微調整だ。ここではデータのラベリングをして、モデルがより正確に異なる概念同士を識別できるようにする。その後の工程では、深層学習によってLLMが単語や概念間の関係や結び付きを理解し、認識できるようにする。
訓練したLLMにプロンプト(指示)を入力することで、プロンプトに対して回答したり、新しくテキストを生成したりできるようになる。
LLMは、自然言語処理タスクに幅広く適用できるため、ますます人気が高まっている。以下で利用例を説明する。