生成AI(ジェネレーティブAI)は、テキストや画像、音声など、さまざまな種類のコンテンツを生成できるAI(人工知能)技術の一種だ。(続きはページの末尾にあります)
調査によると、品質エンジニアリングでの生成AI活用に9割近くの企業が着手しながらも、その大半が実験段階にとどまっている。全社展開を目指す企業を足止めする「壁」の実態とは。
「Microsoft 365 Copilot」は「Office」アプリケーションと連携させて利用できるAIアシスタントだ。Copilotの具体的な利用例や使われている主要技術、役立つプロンプトを解説するホワイトペーパーを3つ紹介する。
Excel×生成AIで現場業務を効率化する動きが加速している。一方で、情シスの知らないところでAIツールが使われる“シャドーAI”も拡大中だ。本資料では、この2つをどう両立させるかのヒントを示す。
成功しても「当たり前」、失敗すれば「集中砲火」――客先常駐SE経験15年、酸いも甘いもかみ分けた元情シス副編集長がニュースの裏側を読み解きます。今回のテーマは「人間が生成AIに負けない仕事とは何か」です。
AI技術の利用が広がる中、業務効率化だけではなく、生産性の向上にもつなげることが重要だ。具体的にはどうすればいいのか。オーストラリアの「3つの活用例」から考える。
ワークマンは、Google Cloudの生成AIツールを導入し、少人数でも効率的に高品質なビジュアルコンテンツを制作できる体制を確立した。導入の背景や活用方法を紹介する。
Googleが画像生成AIモデル「Gemini 3 Pro Image」(通称:Nano Banana Pro)をリリースした。実際の業務に使えるのかどうか、公式ブログの情報を基に、編集者が実際に試した結果を紹介する。
日鉄ソリューションズは、日本の大企業における生成AI活用の実態調査結果を発表した。業務効率化など一定の効果が見られる一方、導入レベルや職種、業種によって活用状況にばらつきがあることが分かった。
Wrikeが日本と米国、英国、ドイツ、フランスの職場におけるAI利用状況の調査結果を発表した。日本の組織のAI利用は、他国の状況と比較してどのような特徴が見られるのか。
生成AIツールを導入しても、全従業員が前向きにツールを活用し、成果を上げるようになるとは限らない。従業員を巻き込んで、生成AIの導入や成果の創出に取り組む企業の事例を紹介する。
カリフォルニア大学は、生成AIコーディング支援ツールへの学生の信頼度推移を調査した。調査結果によると、生成AIに対する信頼は短期的に高まるが、プロジェクトを通じてより慎重な評価へ変わる傾向があった。
ゲーム会社のカプコンは、Googleの「Agent Development Kit」(ADK)や「Gemini」などのAIツールをゲームの企画立案の際に利用する。同社が生成AI技術を利用する狙いとは。
「Claude」を開発するAnthropicが東京に拠点を開設した。日本のAIセーフティ・インスティテュート(AISI)と協力し、AI技術の安全性評価で連携する。同社が政府と組んで、国際的なAI評価基準の策定を進める狙いは。
AI技術の導入を推進したいものの、従業員がAI技術に拒否感を持っていれば計画は滞ってしまう。AI技術に対する従業員の不信感を払しょくし、従業員の支持を得るにはどうすればいいのか。
埼玉大学は、「Felo」などのAIツールをトライアル導入し、運用を開始した。Feloはどのようなツールで、教育現場をどう変える可能性があるのか。
生成AIを用いた情報検索が普及する中、従来のSEOだけではなく、AIツールに「情報源」として選ばれるための新しい戦略「GEO」(生成エンジン最適化)が欠かせなくなっている。具体的な6つのアプローチを解説する。
「スマートフォンは数年にわたって利用し、PCは再生PCを使う」といった動きが広がっている。性能向上と価格低下が進んだことで、企業や個人にとって最新機種への買い替えよりも、「今ある端末をどう生かすか」が重要なテーマになりつつある。
OpenAIは、ChatGPTに、社内ツールの情報を横断的に参照、統合して回答を生成する新機能「company knowledge」を追加した。「Business」「Enterprise」「Edu」プランで利用できる。
企業のAI導入プロジェクトの成否を分けるのは技術力だけではない。AWSを活用するさまざまな業界の組織の事例から、AI導入の成否を分ける“共通点”を読み解く。
企業のAI技術活用が進む中、部門間でデータやAIツールが分断され、成果につながらないという課題が生じている。Googleが発表した「Gemini Enterprise」は、この根深い問題に対してどのような効果を発揮するのか。
生成AIの進化で重要な役割を果たしたのが、深層学習技術の「Transformer」だ。Transformerによって、研究者は学習データにあらかじめラベルを付ける必要がない教師なし学習で、より大規模なモデルを訓練できるようになった。何十億ページ分にも上るテキストを新しいAIモデルに学習させることで、より正確かつ詳細な答えを導き出すことができる。
TransformerはAttentionという機構によって、1文ごとの文章だけでなく、複数のページや章、本にわたる単語間の関係を計算することを可能にしている。要素同士の関係性を計算するTransformerの能力によって、言葉だけでなくソースコードやタンパク質、化学物質、DNA(デオキシリボ核酸)を分析することができる。
何十億個、何兆個ものパラメーターを持つ大規模言語モデル(LLM)の急速な進歩は、生成AIモデルが即座に魅力的な文章を書いたり、写実的な画像を描いたりできる新しい時代を到来させた。複数の種類の情報を同時に処理する「マルチモーダルAI」の登場で、ユーザーはテキストや画像、音声など、複数のメディアを組み合わせてコンテンツを生成できるようになった。OpenAIの画像生成サービス「Dall-E」は、マルチモーダルAIの一つだ。Dall-Eはテキストの説明から画像を自動的に作成したり、画像からテキストのキャプションを生成したりする。
生成AIの進化はまだ初期の段階だ。そのため入力したプロンプト(指示)に対して奇妙な答えを返すこともある。しかし生成AIの能力は、企業のIT活用の方法を劇的に変える可能性がある。今後生成AIは、ソースコードの記述や新薬の設計、製品の開発、業務プロセスの再設計、サプライチェーンの変革に利用できるようになると考えられる。
生成AIは、ユーザーがテキストや画像、動画、デザイン、音符などの形式でプロンプトを入力することで、データ処理を始める。そしてプロンプトを基に新しいコンテンツを出力する。出力できるコンテンツには、文章や問題の解決策、画像、音声などがある。
初期の生成AIは、データを送信するためにAPI(アプリケーションプログラミングインタフェース)やその他の複雑なプロセスを必要とした。OpenAIの「ChatGPT」やGoogleの「Bard」など新たに登場した主要な生成AIサービスでは、ユーザーが自然言語で簡単なプロンプトを入力することで結果を得られるようになっている。やりとりの過程でフィードバックを送信することで、生成結果にユーザーの希望を反映させることもできる。
生成AIモデルは、さまざまなAIアルゴリズムを組み合わせてコンテンツを表現し、処理する。こうした技術は学習データに含まれる偏見や人種差別、誇大広告に基づいた処理結果を出力してしまう可能性がある点に注意が必要だ。
生成AIに使われているAIモデルの具体例として、Googleの「BERT」(Bidirectional Encoder Representations from Transformers)やDeepMind Technologies(現Google DeepMind)が開発した「Google AlphaFold」、OpenAIの「GPT」などが挙げられる。
主な生成AIサービスとして、ChatGPTやDall-E、Bardがある。
OpenAIが手掛けるChatGPTは、AIモデルとして「GPT-3.5」を利用している。GPT-3.5によって、ChatGPTはユーザーインタフェースのチャット機能を通してユーザーと対話したり、やり取りの中で回答を微調整したりすることを可能にしている。2023年3月14日に、同社は新バージョンの「GPT-4」を発表した。
ChatGPTは、ユーザーとの会話履歴を出力結果に組み込む。これによって人間同士の実際の会話のような体験ができることが特徴だ。ChatGPTの登場に合わせて、MicrosoftはOpenAIへの大規模な投資を発表し、GPT-4を同社の検索エンジン「Bing」に組み込んだ。
Dall-Eは、画像とそれに関連するテキスト説明を含む大規模なデータセットで訓練されている。視覚やテキストなど複数の表現方法の間で関連性を識別できる、マルチモーダルAIの一例だ。Dall-Eは言葉の意味を基に画像を生成する。Dall-E 2は、より高性能な2番目のバージョンで、2022年にリリースされた。ユーザーのプロンプトによって複数のスタイルでイメージを生成することができる。
Googleもまた、言語やタンパク質の構造、その他の種類の情報を処理するAIモデルを擁する先駆者である。同社は自社で開発したAIモデルの一部を、研究者向けにオープンソース化して提供している。これらのAIモデルを利用した一般消費者向けのチャットbotサービスは、しばらく発表しなかった。
MicrosoftがBingにGPTを実装するという決定を下した後、GoogleはLLMの「LaMDA」ファミリーの軽量版をベースにした一般向けチャットbot「Google Bard」の開発を急いだ。
Bardは、「初めて太陽系外に惑星を発見したのはジェームズ・ウェッブ宇宙望遠鏡である」という間違った回答を表示したため、同サービスの提供を急いだGoogleの株価が大幅に下落した。MicrosoftがBingにChatGPTを実装した際にも出力結果の不正確さや不安定な動作が見られ、初期の段階でユーザーの期待を薄れさせた。
Googleはその後、同社の新しいLLMである「PaLM 2」を組み込んだBardの新バージョンを発表した。Bardはアップデートによって、ユーザーが入力した質問に対して、画像を含んだ回答やユーザーの需要に合わせた回答ができるようになった。