検索
特集/連載

ChatGPTの「GPT」とは? 仕組みや用途など“ChatGPTの基本”を解説ChatGPTとは何か?

OpenAIが開発したAIサービスの「ChatGPT」は、ユーザーとの対話を基に文章を生成する。ChatGPTはどのような仕組みで動き、どのような用途に役立つのか。基本を説明する。

Share
Tweet
LINE
Hatena
ブックレット表紙
ブックレット「『AI規制』に生成AIベンダーOpenAIのCEOが大賛成する理由」ダウンロードはこちら

 「ChatGPT」は、AI(人工知能)技術ベンダーOpenAIが開発したチャットbot型AIサービスだ。エンドユーザーはChatGPTを使い、記事やソーシャルメディア、メール向けの文章、ソースコードなどを作成できる。

 ChatGPTは「生成AI」(ジェネレーティブAI)ツールの一種だ。生成AIとは、ユーザーの指示を基にテキストや画像、音声などのデータを生成するAI技術を指す。ChatGPTは、企業が顧客向けに提供している自動チャットサービスに似ている。ユーザーが自然言語でプロンプト(生成AIへの指示や質問)を入力すると、ChatGPTがそれに応じた回答を生成する。

 「GPT」は、ChatGPTが利用している「LLM」(大規模言語モデル)のことだ。GPTは「Generative Pre-trained Transformer」の略となっており、どのようにユーザーのプロンプトを処理し、どのように出力結果を生成するかを表している。具体的には、各単語には以下の意味がある。

  • Generative
    • AIモデルがデータを生成する能力を指す。一般的にはテキスト、画像、音声などのデータを生成する。
  • Pre-trained
    • 大規模なデータセットでAIモデルをトレーニングする「事前学習」の段階を指す。AIモデルは事前学習の段階で知識を習得し、さまざまな命令を処理できるようになる。
  • Transformer
    • 「Transformer」は、自然言語処理(NLP)に適した深層学習モデルの一つを指す。ChatGPTは、この技術を基に開発されている。

ChatGPTを開発したOpenAIとは?

 ChatGPTを開発したOpenAIは、イーロン・マスクやサム・アルトマンといった起業家や研究者のグループが2015年に設立した企業だ。同社はMicrosoftをはじめとする複数の企業や投資家の支援を受けており、ChatGPTに加え、テキストの情報を基に画像を生成するAIサービス「Dall-E」を開発している。

ChatGPTの仕組み

 ChatGPTは提供開始当初、LLMとしてGPTの第3世代である「GPT-3」を利用していた。2023年10月時点では、「GPT-3.5」を使用している。

 「ChatGPT Plus」はChatGPTの有償版で、LLMとして「GPT-4」を使用している。GPT-4は従来のバージョンと比較して応答時間が速く、写真の説明や画像のキャプションの生成、最大2万5000語の回答の作成など、より複雑な要求を処理できる。

 ChatGPTのトレーニングには深層学習が使われている。ChatGPTは人間の言葉を学習するために、さまざまなWebサイトの文章や書籍の文章、会話を模した文章などを学習用のデータとして使用している。ユーザーからのフィードバックを受けることで、ChatGPTは継続的にやりとりの精度を改善する。

 ユーザーは、ChatGPTの回答の横にある親指のアイコンをクリックすることで、回答を評価できる。対話能力を改善するために、同サービスの利用中にテキストでフィードバックを提供することもできる。

ChatGPTの“得意分野”とは

 簡単な質問から複雑な質問まで、ChatGPTはユーザーのさまざまな質問に回答できる。STEM(科学、技術、工学、数学)分野に詳しく、デバッグ(エラー修正)をしたりソースコードを書いたりすることも可能だ。ChatGPTが回答できる質問の種類に制限はない。ただしGPT-3.5は学習データとして2021年9月までのデータを使用しているため、それ以降に起こった出来事は知らない。

 ChatGPTは会話型のチャットbotであるため、ユーザーは回答をもらった後に、より詳しい情報を求めたり、別の回答を要求したりできる。ユーザーの質問を記憶することで、ChatGPTの回答は一連の会話の流れを踏まえた内容になる。

 下記は、ChatGPTが役立つ主な用途だ。

  • プログラムのコーディング
  • ソースコードのバグ発見
  • 作曲
  • メールの文章作成
  • 記事やポッドキャスト、プレゼンテーションの要約
  • 記事のタイトル作成
  • 数学の問題を解答
  • Webサイトの記事や、ブログのエントリ(投稿)の作成
  • クイズの作成
  • プレゼンテーション原稿をブログのエントリにするなど、既存コンテンツの書き換え
  • 商品説明の作成
  • ゲームの作成
  • 履歴書や職務経歴書の作成
  • 複雑な話題を簡単に説明
  • 特定市場の調査
  • 小説の執筆
  1. 04#ChatGPTは何に利用できるのか(2024年6月14日更新)

ChatGPTは何に利用できるのか

 企業がChatGPTを導入することで見込めるメリットは以下の通り。

業務自動化

 AI技術を利用することで反復する定形的な作業を処理できるため、従業員はより複雑で戦略的な業務に集中できるようになる。

コスト削減

 例えばカスタマーサービスにAIチャットbotを利用するのは、従業員を新しく雇用してトレーニングするよりもコストが掛からない場合がある。

コンテンツの質の向上

 ユーザー文章を執筆するときに、ChatGPTを使用して文法や文脈の誤りを修正したり、アイデアをブレインストーミングしたりできる。

教育と訓練

 ChatGPTは複雑な話題や理解が難しい分野について説明する、“仮想的な家庭教師”として役立つ。ユーザーは分からないことについて追加の質問をしたり、補足の説明を求めたりすることもできる。

応答時間の改善

 入力された内容に対して即座に応答する点もChatGPTの特徴だ。顧客や従業員は問題解決にかかる時間を減らせる。

可用性の向上

 24時間利用可能なため、ユーザーは継続的にサービスを利用して支援を受けることができる。

多言語対応

 複数の言語でコミュニケーションを取ることができるため、顧客や従業員が世界中にいる多国籍企業でも利用できる。文章の翻訳も可能だ。

パーソナライゼーション

 ChatGPTは、過去の対話に基づいてユーザーの好みや行動に合わせて応答をカスタマイズできる。

スケーラビリティ

 ChatGPTは多数のユーザーからの要望を同時に処理できるため、エンドユーザーの待ち時間を減らせる。

自然言語の理解

 ChatGPTは人間が読み書きするような自然言語を理解して生成するため、コンテンツの生成や質問への回答、会話への参加、説明の提供などのタスクに役立つ。

デジタルアクセシビリティーの実現

 ChatGPTをはじめとしたAIチャットbotは、自然言語に基づいて音声またはテキスト入力で操作ができるため、幅広い年代や属性のユーザーが利用できる。

ChatGPTの限界

ブックレット表紙
ブックレット「『生成AI』を使い倒してビジネスを成功させる“7つの視点”」ダウンロードはこちら

 ChatGPTには、幾つかの技術的な制限事項や欠点がある。その一つが、人間の言語の複雑さを完全には理解していないことだ。ChatGPTは入力に基づいて単語を生成するように訓練されている。そのため、応答が浅薄な内容になることがある。

 ChatGPTに使われるAIモデルの一つであるGPT-3.5は2021年9月までのデータでトレーニングしているため、それ以降の話題に関する知識やデータが不足している。ユーザーの質問内容を完全に理解していない場合や最新の事柄について質問した場合、誤った応答を提供することもある。ChatGPTは継続的な訓練を続けているため、誤った回答があった場合はユーザーからフィードバックを提供できる。

 応答が機械的で、不自然に感じられることもある。ChatGPTは次の単語を予測しながら結果を出力するため、英語の場合は回答に“the”や“and”などの冠詞や接続詞を過剰に使用することがある。そのため出力結果を記事やメールなどのテキストとして使う場合は、ユーザーが内容を確認し、人間らしい文章になるように編集しなければならない。

 情報源を提示しない点にも、ChatGPTの利用時には注意が必要だ。データや統計に対する分析や洞察も提供しない。ChatGPTは統計を提示することがあるが、その出典元や、話題にどのように関連するかについては不明だ。

 ChatGPTは質問の間違った部分に焦点を当ててしまい、その後回答を是正できないことがある。例えば「馬のサイズを考えるとペットに向いていますか?」と聞いてから「猫はどうですか?」と聞くと、ChatGPTは動物のサイズにのみ焦点を当ててしまい、ペットとしての情報を提供できない場合がある。ChatGPTは単一の応答で複数の質問に過不足なく答えることが難しい。

ChatGPTに関する倫理的な懸念

 出力結果に含まれるバイアス(偏見)、プライバシーとセキュリティの欠如、不正行為への利用など、ChatGPTは倫理的な課題を幾つか抱えている。

1.盗作と不正使用

 ChatGPTの出力結果は、不正行為やなりすまし、誤った情報の拡散など、非倫理的な目的に利用される可能性がある。教育者は、学生がChatGPTを使ってカンニングをしたり、盗作をしたり、論文を書いたりすることを懸念している。米国のメディア企業CNET Networksが、2022年にChatGPTを使って間違いのある記事を複数本作成して公開したことが話題になった。

 カンニングや盗用を防止するために、OpenAIは2023年1月に、人間が作成したテキストとAIツールが作成したテキストを区別して検出するツール「AI Text Classifier」を発表した。しかし同社は2023年7月に、"精度の低さ"を理由にサービスの提供を終了した。同社はAI技術で生成されたコンテンツを識別するために、同社のサービスで出力した長いテキストに透かしを追加することを計画している。

 AI技術で生成されたコンテンツを検知するツールは他にもある。Copyleaks TechnologiesのWebサービス「Copyleaks」はその一例だ。同サービスはユーザーがテキストを入力すると、テキストが人によって書かれているのか、AI技術で生成されたのかを検知する。

 ChatGPTはソースコードを書くことができるが、この機能がサイバーセキュリティの脅威になることがある。サイバー攻撃者がChatGPTを使ってマルウェアを作成する可能性があるためだ。OpenAIはChatGPTをアップデートし、マルウェアの作成につながるプロンプトへの応答を停止する機構を導入した。しかし攻撃者が、こうしたOpenAIの安全対策を回避する方法を見つけるリスクは残っている。

 ChatGPTは特定の誰かになりすますために悪用される場合がある。なりすましは、機密情報の収集や偽情報を流布することに使われる可能性がある。

2.トレーニングデータのバイアス

 ChatGPTに関する倫理的な課題の一つが、出力結果のバイアスだ。AIモデルが参照する学習データに偏見があった場合、それがAIモデルの出力結果に反映される。AIモデルは、そのままでは不快または差別的な言語を認識できない。そのため学習データや出力結果をレビューして、バイアスを助長しないようにする必要がある。多様な資料を学習データに含めることで、バイアスを制御できる。

3.AI技術が労働者に置き換わる可能性

 技術が進歩するにつれて、ChatGPTはデータ入力や処理、カスタマーサービス、翻訳サポートなど、人間がする作業を自動化する可能性がある。これにより、人々は自分の仕事が置き換えられるのではないかと心配している。そのためChatGPTをはじめとしたAI技術が労働者に与える影響を考慮することが重要だ。

 労働者を置き換えるのではなく、ChatGPTは仕事の機能をサポートし、新しい雇用機会を創出するために利用できる。例えば弁護士はChatGPTを使用して案件の要約を作成したり、契約書や合意書の草案を作成したりできる。コピーライターはChatGPTを使用して記事のアウトラインや見出しのアイデアを得ることができる。

4.プライバシーの問題

 入力されたプロンプトによっては、ChatGPTが機密情報を漏らす可能性がある。チャットの履歴から収集できる情報や入力内容を、ユーザーの電話番号やメールアドレスと関連付けて保管される場合がある。こうした情報は、ユーザーを追跡したり、プロファイリングしたりすることに使われる可能性がある。

ChatGPTの利用方法

 ChatGPTを利用開始するにはまず、OpenAIアカウントを作成する必要がある。Webサイト「chat.openai.com」にアクセスし、「サインアップ」を選択してメールアドレスを入力する。GoogleアカウントまたはMicrosoftアカウントを使用して登録することもできる。

 ユーザーはアカウントを作成したら、ChatGPTのメッセージボックスにプロンプトや質問を入力できるようになる。ChatGPTのユーザーインタフェースでは、以下の機能が利用できる。

  • 応答の後別のプロンプトを入力したり、応答に追加の説明を求めたりする
  • 応答を再生成する
  • 応答を他のユーザーと共有する
  • 親指のアイコンを押して応答の評価をする
  • 応答をコピーする
  1. 08#ChatGPTが満員の場合の対処方法(2024年6月14日更新)

ChatGPTが満員の場合の対処方法

 ChatGPTは複数のユーザーを同時に処理できるが、定員オーバーになるとサービスが利用できなくなる。この現象は、ユーザーがいる国やタイムゾーンによるが、早朝や夕方に起こる傾向にある。

 満員の場合は、異なる時間に試すか、Webブラウザを更新するとよい。もう一つの方法が、有償版のChatGPT Plusにアップグレードすることだ。同プランを利用すれば、ChatGPTが定員オーバーになったときも利用できるようになる。

ChatGPTの代替案は?

 前述の通り、ChatGPTは定員オーバーで利用できない場合がある。そのようなときには代替サービスの利用を検討するとよい。GoogleはChatGPTに対抗して、チャットbot型AIサービスの「Google Bard」を発表した。2024年2月に、同サービスの名称は「Gemini」に変わった。GeminiはGoogleの検索エンジンを通じて、さまざまなWebサイトから直接最新の情報を取得している。Microsoftは検索エンジンの「Bing」にGPT-4を組み込み、Web検索をチャット形式でできるようにした。その他にもChatGPTの代替テキスト生成ツールとして、DeepLの「DeepL Write」やPerplexity AIの同名サービスなどが挙げられる。ソースコードを生成できるツールとしては、Amazon Web Servicesの「Amazon CodeWhisperer」やSourceGraphの「SourceGraph」などがChatGPTの代わりに利用できる。

ChatGPTのアップデートの歴史

 OpenAIは2023年8月に、企業向けのサービス「ChatGPT Enterprise」を発表した。ChatGPT Enterpriseは、より長いコンテキストウィンドウ(言語モデルが参照できる過去のやりとりの量)やチャットの内容のカスタマイズ機能、セキュリティ対策機能、データ分析機能などを備えた、より高速なGPT-4モデルが利用可能だ。ChatGPT Enterpriseは、エンドユーザーの入力内容AIモデルの開発に利用しないため、ユーザー企業は自社のデータを保護できる。

 2023年9月には、同社はChatGPTが音声や画像を認識したりするための機能を更新した。例えばユーザーが冷蔵庫の中身の写真をアップロードすると、ChatGPTが夕食のアイデアを提供する。また建築物や風景の写真をアップロードして質問すると、ChatGPTはその写真に写るものに関する事実や歴史を説明できる。画像認識機能はスマートフォン向けのChatGPTアプリケーションとChatGPTのWebアプリケーションで利用可能だ。ユーザーはChatGPTに話しかけて、一般的な音声アシスタントサービスのように利用することも可能だ。この音声機能は「iOS」と「Android」スマートフォン向けのChatGPTアプリケーションで利用できる。

 2023年11月にOpenAIは、ユーザーが特定の用途に合わせてChatGPTをカスタマイズできる「GPTs」を発表した。ユーザーはGPT Builderに指示や新しい知識を入力することでカスタマイズが可能だ。例えばソーシャルメディアの投稿のみを作成するGPTsやコードのバグを確認するGPTs、製品説明を作成するGPTsなどの作成ができる。OpenAIは同月に、ユーザーがカスタムGPTsを共有したり収益化したりできる「GPT Store」も発表した。

 2023年12月、OpenAIはドイツを拠点とするメディア企業のAxel Springerと提携し、報道記事でAIモデルを訓練することを発表した。この合意により、ユーザーはChatGPTを使ってAxel Springerのニュースサイトである「Business Insider」や「Politico」などで公開されたニュース記事の要約を見ることができるようになる。これらのニュース記事は、ChatGPTの学習にも使われる。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る