生成AI(ジェネレーティブAI)は、テキストや画像、音声など、さまざまな種類のコンテンツを生成できるAI(人工知能)技術の一種だ。(続きはページの末尾にあります)
AI市場は2026年以降、停滞する可能性がある。これに伴い、AIベンダーの再編やAI投資の縮小が起きることが予測される。“AIバブル”が崩壊する中で、ユーザー企業はどのようにAI戦略を立てるべきなのか。
積極的にAI人材を引き抜くMeta Platformsが組織を再構築し、AI開発へいよいよ本腰を入れる。どのような狙いがあるのか。課題は。
AIベンダーAnthropicは130億ドルの資金を調達し、評価額が1830億ドルに達した。2025年3月からほぼ3倍に成長したことになる。しかし同社は課題にも直面している。今後、同社が乗り越えるべき壁とは。
AIモデル開発の覇権を争うMetaが、100億ドル規模の契約をGoogleと締結した。AIモデルや広告市場で競合する両社が、なぜインフラ分野では手を組むのか。一見矛盾した提携の裏にある、AI市場の奇妙な構図とは。
ChatGPTや生成AIに続き、注目を集めることになった「エージェント型AI」。自律的にタスクを実行するこの技術は定着するのか、それとも“次の流行”に取って代わられるのか。
AIエージェントへの期待が高まる中で、その実用性に対しては懐疑的な意見も少なくない。現場で成果を上げるAIシステム設計のポイントを、ベンダー2社に聞いた。
Appleが「推論モデル」の限界を指摘する論文を発表し、AI業界に一石を投じた。肯定的な見方と否定的な見方が飛び交う中、論文が示す本当の意図を読み解く。
Goldman Sachsによると、AI技術の普及によって3億人の雇用に影響が生じる可能性がある。AI技術を活用するITベンダーは、従業員の雇用方針をどのように考えているのか。
AI技術に関するバイアスの問題を、女子は男子よりも深刻に受け止めていることが調査から判明した。この認識の差は、IT業界に存在するある問題に起因するという。どのような“負の連鎖”を引き起こす恐れがあるのか。
生成AIブームが熱を帯びる中、世間の関心が失われる「幻滅期」の到来は避けられないとの見方がある。生成AIへの関心はなぜ薄れてしまうのか。生成AI市場は今後どうなるのか。
2022年11月に「ChatGPT」が公開された。ChatGPTはさまざまな人工知能(AI)技術を礎としている。他にはどのような技術が登場したのか。その歴史をおさらいする。
Googleは「Gemini 2.0 Pro」をはじめとする新モデル群を発表し、AI市場における攻勢を一段と強めている。Geminiアップデートによるユーザーへのメリットと、GoogleのAI戦略を解説する。
生成AIの活用を業務レベルに落とし込むには、生成AIの活用法やトレンドを把握しておくことが肝要だ。生成AIに関する2025年のトレンドを5つ紹介する。
生成AIの次のステップとして注目を集める「AIエージェント」だが、技術的な制約や市場の未成熟さといった課題も浮き彫りになっている。専門家はこの技術の展望についてどのような見解を示しているのか。
「邪悪になるな」「正しいことをやれ」を行動規範に掲げてきたGoogleが、AI技術を軍事目的で利用しないとする誓約を撤回した。Googleの方針転換には何が影響しているのか。
2024年、生成AIが普及したことで人間の仕事は奪われたのか。企業は生成AIへの投資に見合った収益を得ることができたのか――生成AIへの期待と不安、その“答え”を専門家の見解を基に紹介する。
若手優位なイメージの強いスタートアップ市場だが、こうした「年齢の壁」はAI時代に取り払われつつあるという。シニア起業家に注目が集まるのはなぜなのか。
「ChatGPT」をきっかけとしたAIブームは、突然始まったわけではない。10年間で起きた主要な出来事を基に、AIの歴史をおさらいしよう。
「ROIが見通せない」という理由で生成AIの活用に後れを取っていた企業でも、その効果を享受できている実態が判明した。生成AIのROIはどの程度なのか。
過熱気味だった生成AIブームは収束に向かい、今後は世間の関心が薄れる「幻滅期」が到来するという見方がある。このような厳しい時期を乗り切って成果を出すために、企業にはどのような取り組みが求められるのか。
生成AIの進化で重要な役割を果たしたのが、深層学習技術の「Transformer」だ。Transformerによって、研究者は学習データにあらかじめラベルを付ける必要がない教師なし学習で、より大規模なモデルを訓練できるようになった。何十億ページ分にも上るテキストを新しいAIモデルに学習させることで、より正確かつ詳細な答えを導き出すことができる。
TransformerはAttentionという機構によって、1文ごとの文章だけでなく、複数のページや章、本にわたる単語間の関係を計算することを可能にしている。要素同士の関係性を計算するTransformerの能力によって、言葉だけでなくソースコードやタンパク質、化学物質、DNA(デオキシリボ核酸)を分析することができる。
何十億個、何兆個ものパラメーターを持つ大規模言語モデル(LLM)の急速な進歩は、生成AIモデルが即座に魅力的な文章を書いたり、写実的な画像を描いたりできる新しい時代を到来させた。複数の種類の情報を同時に処理する「マルチモーダルAI」の登場で、ユーザーはテキストや画像、音声など、複数のメディアを組み合わせてコンテンツを生成できるようになった。OpenAIの画像生成サービス「Dall-E」は、マルチモーダルAIの一つだ。Dall-Eはテキストの説明から画像を自動的に作成したり、画像からテキストのキャプションを生成したりする。
生成AIの進化はまだ初期の段階だ。そのため入力したプロンプト(指示)に対して奇妙な答えを返すこともある。しかし生成AIの能力は、企業のIT活用の方法を劇的に変える可能性がある。今後生成AIは、ソースコードの記述や新薬の設計、製品の開発、業務プロセスの再設計、サプライチェーンの変革に利用できるようになると考えられる。
生成AIは、ユーザーがテキストや画像、動画、デザイン、音符などの形式でプロンプトを入力することで、データ処理を始める。そしてプロンプトを基に新しいコンテンツを出力する。出力できるコンテンツには、文章や問題の解決策、画像、音声などがある。
初期の生成AIは、データを送信するためにAPI(アプリケーションプログラミングインタフェース)やその他の複雑なプロセスを必要とした。OpenAIの「ChatGPT」やGoogleの「Bard」など新たに登場した主要な生成AIサービスでは、ユーザーが自然言語で簡単なプロンプトを入力することで結果を得られるようになっている。やりとりの過程でフィードバックを送信することで、生成結果にユーザーの希望を反映させることもできる。
生成AIモデルは、さまざまなAIアルゴリズムを組み合わせてコンテンツを表現し、処理する。こうした技術は学習データに含まれる偏見や人種差別、誇大広告に基づいた処理結果を出力してしまう可能性がある点に注意が必要だ。
生成AIに使われているAIモデルの具体例として、Googleの「BERT」(Bidirectional Encoder Representations from Transformers)やDeepMind Technologies(現Google DeepMind)が開発した「Google AlphaFold」、OpenAIの「GPT」などが挙げられる。
主な生成AIサービスとして、ChatGPTやDall-E、Bardがある。
OpenAIが手掛けるChatGPTは、AIモデルとして「GPT-3.5」を利用している。GPT-3.5によって、ChatGPTはユーザーインタフェースのチャット機能を通してユーザーと対話したり、やり取りの中で回答を微調整したりすることを可能にしている。2023年3月14日に、同社は新バージョンの「GPT-4」を発表した。
ChatGPTは、ユーザーとの会話履歴を出力結果に組み込む。これによって人間同士の実際の会話のような体験ができることが特徴だ。ChatGPTの登場に合わせて、MicrosoftはOpenAIへの大規模な投資を発表し、GPT-4を同社の検索エンジン「Bing」に組み込んだ。
Dall-Eは、画像とそれに関連するテキスト説明を含む大規模なデータセットで訓練されている。視覚やテキストなど複数の表現方法の間で関連性を識別できる、マルチモーダルAIの一例だ。Dall-Eは言葉の意味を基に画像を生成する。Dall-E 2は、より高性能な2番目のバージョンで、2022年にリリースされた。ユーザーのプロンプトによって複数のスタイルでイメージを生成することができる。
Googleもまた、言語やタンパク質の構造、その他の種類の情報を処理するAIモデルを擁する先駆者である。同社は自社で開発したAIモデルの一部を、研究者向けにオープンソース化して提供している。これらのAIモデルを利用した一般消費者向けのチャットbotサービスは、しばらく発表しなかった。
MicrosoftがBingにGPTを実装するという決定を下した後、GoogleはLLMの「LaMDA」ファミリーの軽量版をベースにした一般向けチャットbot「Google Bard」の開発を急いだ。
Bardは、「初めて太陽系外に惑星を発見したのはジェームズ・ウェッブ宇宙望遠鏡である」という間違った回答を表示したため、同サービスの提供を急いだGoogleの株価が大幅に下落した。MicrosoftがBingにChatGPTを実装した際にも出力結果の不正確さや不安定な動作が見られ、初期の段階でユーザーの期待を薄れさせた。
Googleはその後、同社の新しいLLMである「PaLM 2」を組み込んだBardの新バージョンを発表した。Bardはアップデートによって、ユーザーが入力した質問に対して、画像を含んだ回答やユーザーの需要に合わせた回答ができるようになった。