生成AI(ジェネレーティブAI)は、テキストや画像、音声など、さまざまな種類のコンテンツを生成できるAI(人工知能)技術の一種だ。(続きはページの末尾にあります)
「データ分析」に関するTechTargetジャパンの記事のうち、2024年に新規会員の関心を集めたものは何だったのでしょうか。ランキングで紹介します。
Microsoft「Copilot」とGoogle「Gemini」は、どちらもAI導入を検討する企業にとって有力な選択肢となる。どのような基準で選ぶべきなのか。9つの観点から比較解説する。
「ChatGPT」と「Gemini」にはどのような違いがあるのか。生成AIの回答を改善するためのプロンプトの作り方とは。生成AI活用に当たっての基礎知識と、利用時のこつをまとめて紹介する。
MicrosoftのAIアシスタント「Copilot」は、実際にどう役立つのか。「Excel」や「PowerPointなどのアプリケーションを例にして解説する。
急速にAI技術の普及が進む中で、ネットワークエンジニアに求められる新たな役割と知識が浮き彫りになってきた。「AI時代」の今、ネットワークエンジニアが競争力を高めるために必要なスキルや視点とは。
Google Cloudの調査レポートによると、英国公共部門が生成AIツールを活用すると年間380億ポンドのコスト削減が可能という。ただし、生成AIツールを活用するまでには越えなければならない壁がある。
OpenAIは動画生成AIモデルの強化版を、掲示板型ソーシャルニュースサイト「Reddit」はAIチャットbotをそれぞれ公開した。Googleが席巻する動画生成の市場と検索サービスの市場に両社はどのような変化を起こすのか。
2024年12月2〜6日に米ラスベガスで「AWS re:Invent」が開催されている。AWSのCEOマット・ガーマン氏が登壇した基調講演で発表された新サービスや新機能を解説する。
AI関連事業の強化を背景にして、Microsoftの事業が好調だ。特にどの製品・サービスが好調なのか。2025年度第1四半期の業績発表を基に解説する。
生成AIは業務をはじめさまざまな場面で利用できる“便利ツール”となりつつある。プロンプトを入力するだけで、画像や音楽を生成できるAIツール10選を紹介する。
生成AIの業務活用が進み、さまざまなベンダーが生成AIツールを提供している。業務効率化を期待できる、文章作成で役立つ生成AIツール「12選」を紹介する。
ビジネスにおける生成AI実装は着実に進んでおり、日常業務に欠かせない存在となりつつある。2024年、生成AIの導入はどの程度進んだのか。特定の部門で導入が遅れている理由とは。
トランプ氏は「言論や表現の自由を守る」と宣言し、SNSの投稿の誤情報を監視する「コンテンツモデレーター」をやり玉に挙げている。一方で専門家は、言論の自由を妨げる“根本的な問題”があると指摘する。その問題とは。
生成AIの開発競争が激化している。Googleは最新鋭の生成AI「Gemini」、対するOpenAIは動画生成AI「Sora」を発表して話題をさらった。他方、契約内容を巡ってマスク氏がOpenAIを提訴する事態も起きた。混とんとする業界動向をまとめた。
Microsoftは生成AIセキュリティツール「Copilot for Security」の一般提供を開始する。従来のセキュリティ製品と何が違うのか。
Googleの親会社Alphabetの2024年第3四半期の売上高が前年比15%増を記録した。この成長を支えているのは、顧客向けAIサービスの提供だけではなく、自社開発における「Gemini」の活用にもあるという。
「ChatGPT」をきっかけとしたAIブームは、突然始まったわけではない。10年間で起きた主要な出来事を基に、AIの歴史をおさらいしよう。
「ROIが見通せない」という理由で生成AIの活用に後れを取っていた企業でも、その効果を享受できている実態が判明した。生成AIのROIはどの程度なのか。
生成AIの進化で重要な役割を果たしたのが、深層学習技術の「Transformer」だ。Transformerによって、研究者は学習データにあらかじめラベルを付ける必要がない教師なし学習で、より大規模なモデルを訓練できるようになった。何十億ページ分にも上るテキストを新しいAIモデルに学習させることで、より正確かつ詳細な答えを導き出すことができる。
TransformerはAttentionという機構によって、1文ごとの文章だけでなく、複数のページや章、本にわたる単語間の関係を計算することを可能にしている。要素同士の関係性を計算するTransformerの能力によって、言葉だけでなくソースコードやタンパク質、化学物質、DNA(デオキシリボ核酸)を分析することができる。
何十億個、何兆個ものパラメーターを持つ大規模言語モデル(LLM)の急速な進歩は、生成AIモデルが即座に魅力的な文章を書いたり、写実的な画像を描いたりできる新しい時代を到来させた。複数の種類の情報を同時に処理する「マルチモーダルAI」の登場で、ユーザーはテキストや画像、音声など、複数のメディアを組み合わせてコンテンツを生成できるようになった。OpenAIの画像生成サービス「Dall-E」は、マルチモーダルAIの一つだ。Dall-Eはテキストの説明から画像を自動的に作成したり、画像からテキストのキャプションを生成したりする。
生成AIの進化はまだ初期の段階だ。そのため入力したプロンプト(指示)に対して奇妙な答えを返すこともある。しかし生成AIの能力は、企業のIT活用の方法を劇的に変える可能性がある。今後生成AIは、ソースコードの記述や新薬の設計、製品の開発、業務プロセスの再設計、サプライチェーンの変革に利用できるようになると考えられる。
生成AIは、ユーザーがテキストや画像、動画、デザイン、音符などの形式でプロンプトを入力することで、データ処理を始める。そしてプロンプトを基に新しいコンテンツを出力する。出力できるコンテンツには、文章や問題の解決策、画像、音声などがある。
初期の生成AIは、データを送信するためにAPI(アプリケーションプログラミングインタフェース)やその他の複雑なプロセスを必要とした。OpenAIの「ChatGPT」やGoogleの「Bard」など新たに登場した主要な生成AIサービスでは、ユーザーが自然言語で簡単なプロンプトを入力することで結果を得られるようになっている。やりとりの過程でフィードバックを送信することで、生成結果にユーザーの希望を反映させることもできる。
生成AIモデルは、さまざまなAIアルゴリズムを組み合わせてコンテンツを表現し、処理する。こうした技術は学習データに含まれる偏見や人種差別、誇大広告に基づいた処理結果を出力してしまう可能性がある点に注意が必要だ。
生成AIに使われているAIモデルの具体例として、Googleの「BERT」(Bidirectional Encoder Representations from Transformers)やDeepMind Technologies(現Google DeepMind)が開発した「Google AlphaFold」、OpenAIの「GPT」などが挙げられる。
主な生成AIサービスとして、ChatGPTやDall-E、Bardがある。
OpenAIが手掛けるChatGPTは、AIモデルとして「GPT-3.5」を利用している。GPT-3.5によって、ChatGPTはユーザーインタフェースのチャット機能を通してユーザーと対話したり、やり取りの中で回答を微調整したりすることを可能にしている。2023年3月14日に、同社は新バージョンの「GPT-4」を発表した。
ChatGPTは、ユーザーとの会話履歴を出力結果に組み込む。これによって人間同士の実際の会話のような体験ができることが特徴だ。ChatGPTの登場に合わせて、MicrosoftはOpenAIへの大規模な投資を発表し、GPT-4を同社の検索エンジン「Bing」に組み込んだ。
Dall-Eは、画像とそれに関連するテキスト説明を含む大規模なデータセットで訓練されている。視覚やテキストなど複数の表現方法の間で関連性を識別できる、マルチモーダルAIの一例だ。Dall-Eは言葉の意味を基に画像を生成する。Dall-E 2は、より高性能な2番目のバージョンで、2022年にリリースされた。ユーザーのプロンプトによって複数のスタイルでイメージを生成することができる。
Googleもまた、言語やタンパク質の構造、その他の種類の情報を処理するAIモデルを擁する先駆者である。同社は自社で開発したAIモデルの一部を、研究者向けにオープンソース化して提供している。これらのAIモデルを利用した一般消費者向けのチャットbotサービスは、しばらく発表しなかった。
MicrosoftがBingにGPTを実装するという決定を下した後、GoogleはLLMの「LaMDA」ファミリーの軽量版をベースにした一般向けチャットbot「Google Bard」の開発を急いだ。
Bardは、「初めて太陽系外に惑星を発見したのはジェームズ・ウェッブ宇宙望遠鏡である」という間違った回答を表示したため、同サービスの提供を急いだGoogleの株価が大幅に下落した。MicrosoftがBingにChatGPTを実装した際にも出力結果の不正確さや不安定な動作が見られ、初期の段階でユーザーの期待を薄れさせた。
Googleはその後、同社の新しいLLMである「PaLM 2」を組み込んだBardの新バージョンを発表した。Bardはアップデートによって、ユーザーが入力した質問に対して、画像を含んだ回答やユーザーの需要に合わせた回答ができるようになった。