ChatGPT-4o(GPT-4o)とは 使い方とできること、活用事例を紹介
2022年末にChatGPTがリリースされたことを皮切りに、生成AIに注目が集まっています。開発元のOpenAI社のほか、Google社、Microsoft社、Meta社といったIT業界の最大手の企業がこぞって生成AIの開発に乗り出し、競うように新技術を開発しています。
そんななか、OpenAI社は、GPTシリーズの最新バージョンとして生成AIモデルのGPT-4oを2024年5月にリリースしました。これまでのバージョンを大きく凌駕する性能を誇っていて、生成AIを用いたサービスのさらなる躍進に期待されています。
ChatGPT-4o(GPT-4o)とは
ChatGPT-4oは、2024年5月にリリースされた最新モデルのChatGPTです。厳密には、大規模言語モデル(LLM)のGPT-4o(GPT-4 Omini)が搭載された、AIチャットのChatGPTを指します。
関連記事:ChatGPTとは?始め方と使い方の解説とSEOコンサルタントによる簡単なAIアルゴリズムの検証
ChatGPTとGPT-4oの違いについて
ChatGPTは、LLMのGPT-4oを搭載したAIチャットツールです。ユーザーがチャット上でプロンプト(質問文)を送信すると、回答文やコンテンツを生成するサービスです。
一方、GPT-4oはAIモデルですので、車のエンジンのように、(コンテンツ生成のための)動力源としての役割を担います。そのため、単体で動作するサービスではありません。
GPT-4o(GPT-4 Omini)の性能と改善ポイント
大規模言語モデルのGPT-4o(GPT-4 Omini)は、前身のGPT4やGPT-4 Turboと比較して、次のような点が改善されました。
- マルチモーダル対応できるファイルが増えた
- 言語のテキスト理解力が改善された
- 応答がはやくなった
改善ポイントをまとめると、GPT-4oは、前モデルと比較して、コンテンツに対する理解力と処理能力が大幅に向上しました。
マルチモーダル対応できるファイルが増えた
GPTでは、これまでテキストと画像のコンテンツに対応していました。さらに、GPT-4oでは、音声、動画のコンテンツを扱えるようになりました。具体的には、テキスト、画像、音声、動画の4つのコンテンツを組み合わせて入力できるようになりました。
GPT-4oでは、とくに、音声の理解と画像の視認力が向上したとのことです。
言語のテキスト理解力が改善された
英語テキストに対する理解力は高水準を維持しつつ、他の自然言語ではテキスト理解力が大幅に改善されました。
自然言語のテキスト処理において、処理能力を表す指標として、言語トークンと呼ばれる単位が用いられます。テキストを処理する際に、トークン数が少ないほど、AIモデルとしての性能が高いことを示します。そして、GPT-4oでは、次の自然言語で必要なトークン数が大幅に削減されました。具体的には、次のような言語のトークン数の減少に成功しています。
言語トークンが減少した自然言語 | ||
グジャラート語 | テルグ語 | タミル語 |
マラーティー語 | ヒンディー語 | ウルドゥー語 |
アラビア語 | ペルシア語 | ロシア語 |
韓国語 | ベトナム語 | 中国語 |
日本語 | トルコ語 | イタリア語 |
ドイツ語 | スペイン語 | ポルトガル語 |
フランス語 | 英語 | – |
応答がはやくなった
GPT-4oでは、応答がはやくなり、応答速度が大幅に向上しました。とくに、音声入力に対しては、232ミリ秒(0.232秒)で応答できます。これは、人間同士でコミュニケーションをとるのと同等の応答速度です。なお、これまでのGPT-4では、音声入力に対する応答に、5.4秒ほど要していました。
GPT-4o(GPT-4 Omini)と類似する生成AIモデル
OpenAI社は、同社調べによるGPT-4oと他社のAIモデルの性能差を公開しています。この情報では、次のようなデータを提供しています。
- テキスト理解の比較
- 音声理解の比較
- 画像理解の比較
テキスト理解の比較
テキスト理解に関して、GPT、Claude、Geminiシリーズの各々AIモデルにおける評価の比較を公開しています。下記画像は、テキストに対する性能評価をグラフ化したものです。
引用:Hello GPT-4o
このデータをみると、GPT-4oは、長文理解に対する評価は平均的であるものの、すべての項目で高水準の性能を有していることが伺えます。参考までに、それぞれの項目(ベンチマーク)で評価されるポイントは次のとおりです。
ベンチマーク | 評価ポイント |
---|---|
MMLU | 知識力、問題解決能力、言語理解力 |
GPQA | 専門性、推論能力 |
MATH | 数学的推論能力 |
HumanEval | プログラミング能力 |
MGSM | 基礎的な数学的推論能力、多言語力 |
DROP | 長文の理解力 段落の理解力 |
音声理解の比較
音声理解に関しては、OpenAI社、Meta社、Google社の3社のAIモデルのパフォーマンスを比較しています。ここでは、CoVoST-2と呼ばれる、多言語における音声翻訳の指標をグラフで示しています。
引用:Hello GPT-4o
GPT-4o(42ポイント)は、Google社の最新AIモデルのGemini Pro 1.5(41ポイント)を1ポイントだけ上回っているという結果が出ているようです。
画像理解の比較
画像理解については、GPT、Gemini、Cludeの3シリーズ間で比較しています。
引用:Hello GPT-4o
この結果では、GPT-4oがすべての項目で最高値をマークしています。つまり、画像に対する解釈力に秀でていることがわかるということです。また、それぞれの項目が示す評価は下記のとおりです。
ベンチマーク | 評価ポイント |
---|---|
MMLU | 知識力、問題解決能力、言語理解力 |
Math Vista | グラフや図に対する数学的な推論力 |
AI2D | 図に対する解釈能力、推論力 |
ChartQA | グラフに対する解釈能力、推論力 |
DocVQA | 文章画像の解釈力、応答力 |
ActivityNet | 動画の解釈力、時系列の解釈力 |
EgoSchema | 画像撮影者の視点による画像に対する解釈能力 |
無料版のChatGPTでできること
無料版のChatGPTでは、下記のようなことができます。
- 回数制限ありでGPT-4oを利用できる
- Google Drive、Microsoft OneDriveと連携できる
- 既存のカスタムGPTを利用できる
回数制限ありでGPT-4oを利用できる
無料版のChatGPTでは、回数制限が課されるもののGPT-4oを利用できます。2024年7月現在では、この回数制限は、時間経過でリセットされます。
GPT-4oは、高度な言語理解力や推論力を備えています。そのため、複雑な質問にも応答できます。このほか、マルチモーダルに対応していて、画像や音声ファイルを理解する能力があります。アップロードしたファイルを交えたチャットの応答も可能です。
Google Drive、Microsoft OneDriveと連携できる
無料版のChatGPTで、Google DriveやMicrosoft OneDriveと連携できます。
連携後は、クラウド上のファイルにアクセスできます。たとえば、ドキュメントファイルを呼び出して、内容を要約したテキストを生成するといったことができます。ただし、この機能は、GPT-4oでないと使用できません。
既存のカスタムGPTを利用できる
無料版のChatGPTでも、カスタムGPTを利用できます。
カスタムGTPとは、ChatGPTをカスタマイズする機能のことです。ChatGPTに特定の知識を付与して専門性を高めることで、分析に特化した応答、プログラム生成に特化した応答などが実現します。カスタマイズ時には、既存の知識やスキルを組み合わせて独自のChatGPTに仕上げることができます。
有料版のChatGPT Plusでできること
有料版のChatGPT Plusでは、次のようなことができます。
- GPT-4oの制限緩和
- 新たなカスタムGPTを作成できる
- 画像を生成できる
- 音声入力したデータを文字起こしできる
GPT-4oの制限緩和
有料版のChatGPT Plusでは、GPT-4oの回数制限が大幅に緩和されます。さらに、有料版では、画像生成AIなどの機能が解放されますので、GPT-4oと組み合わせて画像を生成するといったこともできます。
新たなカスタムGPTを作成できる
有料版のChatGPT Plusを購入すると、カスタムGPTを新たに作成できるようになります。この機能により、自身の目的にあったChatGPTにカスタマイズが可能です。カスタマイズの方法も簡単で、「◯◯に適したGPTを作成して」などと指示すると自動でカスタムGPTを生成してくれます。
画像を生成できる
有料版のChatGPT Plusでは、画像の生成が可能です。無料版からアップデートすると、画像生成AIのDALL-Eの機能が解放されます。チャットで「◯◯の画像を描いて」とプロンプトを打ち込むと、指示に従って画像が生成されます。
音声入力したデータを文字起こしできる
有料版のChatGPT Plusにアップグレードすると、音声入力の機能を利用できるようになります。この機能では、マイクを通じて話した内容や再生した音声ファイルを音源として、プロンプトに入力できます。その音源は、チャット上で自動的にテキスト化されます。
ChatGPT-4oの始め方
ChatGPT-4oを始める手順は下記のとおりです。
- ChatGPTにアクセスする
- 「サインアップ」をクリックする
- 任意の方法でアカウントを作成してログインする
- 氏名、生年月日を入力のうえ、利用規約を読んで「同意する」をクリックする
- ChatGPTのヒントを読んで「それでは始めましょう」をクリックする
ChatGPT-4oの操作方法
ChatGPT-4oの画面の見方や操作方法を解説します。
合番 | 解説 |
---|---|
① | 新規チャット。新たなチャットを立ち上げる |
② | GPTを探す。ChatGPTをカスタマイズするための追加知識を付与する |
③ | チャット履歴。過去のチャットを表示する |
④ | プランアップグレード。有料プランを購入する際に利用する |
⑤ | ChatGPTの切り替え。使用するAIチャットをChatGPT、ChatGPT Plusに切り替える |
⑥ | チャットスペース。プロンプトに対する応答内容が表示される |
⑦ | チャットフォーム。プロンプトの入力、添付ファイルのアップロードができる |
⑧ | チャット共有。チャットのURLを生成して外部に共有できる |
⑨ | アカウント情報。ログインしているアカウントの情報を表示するほか、各種設定を変更できる |
⑩ | ヘルプ情報。ChatGPTのヘルプページやFAQを閲覧できる |
チャットの編集
合番 | 解説 |
---|---|
① | メッセージ編集。プロンプトを修正して、新たな応答を取得できる |
② | 応答内容の候補。プロンプトに対する応答パターンを表示できる |
③ | 音声読み上げ。応答テキストを音声で読み上げしてくれる |
④ | コピー。応答テキストをコピーできる |
⑤ | 再生成。応答内容を再度生成し直せる |
⑥ | バッド評価。適切な応答でない場合は、バッド評価であることをChatGPTに伝えられる |
⑦ | AIモデル変更。使用するAIモデルとして、GPT-4o、GPT-3.5のいずれかを選択できる |
ChatGPT-4oの使い方
ChatGPT-4oの基本的な使い方について、具体的な手順を交えてご紹介します。
- 画像生成する手順
- 入力した音声を文字起こしする手順
- Google Drive、Microsoft OneDriveと連携する手順
- カスタムGPTを利用する手順
- ウェブブラウジング機能で最新情報を取得する手順
画像生成する手順
ChatGPT-4oで画像生成するための手順は下記のとおりです。
- 有料プランのChatGPT Plusを購入する
- チャットで画像生成のためのプロンプトを送信する
無料版のChatGPTでは、画像生成に必須となるDALL-Eを使えません。そのため、ChatGPTで画像生成するためには、有料版のChatGPT Plusを購入する必要があります。
なお、画像生成のプロンプト(指示文章)では、具体的な描写を形容詞を交えて指示すると、利用する画像が生成されやすくなります。
入力した音声を文字起こしする手順
ChatGPT-4oで音声データを文字起こしするための手順をご紹介します。
- 有料プランのChatGPT Plusを購入する
- チャットでマイクアイコンをクリックする
- 音声を吹き込む
ただし、2024年7月現在のChatGPT Plusでは、デバイス内の音声や動画ファイルをアップロードして、直接的に文字起こしする機能はありません。あくまでも、マイクで音声を吹き込む工程が必要です。また、無料版のChatGPTでは、音声入力の機能を利用できません。
Google Drive、Microsoft OneDriveと連携する手順
ChatGPT-4oでは、Google Drive、またはMicrosoft OneDriveと連携することが可能です。その手順は下記のとおりです。
- チャットの添付アイコンをクリックする
- Google Drive(または、Microsoft OneDrive)をクリックする
- Google Driveのアカウントにログインのうえで、接続を許可する
- チャットの添付アイコンをクリックして、「Google Driveから追加する」をクリックする
- 任意のファイルを選んで「選択」をクリックする
- アップロードが完了したら、チャットでプロンプトを送信する
カスタムGPTを利用する手順
カスタムGPTの使い方は、次のとおりです。
- メニュー「GPTを探す」をクリックする
- 任意のアクション(知識やスキル)を選択する
- 「チャットを開始する」をクリックする
ウェブブラウジング機能で最新情報を取得する手順
有料版のウェブブラウジング機能を利用することで、ChatGPTで最新情報にアクセスすることができます。
- 有料プランのChatGPT Plusを購入する
- 「設定」をクリックする
- 「Beta features」を選択のうえで「Brouse with Bing」をオンにする
ChatGPT-4oの活用事例
ChatGPT-4oを応用した、実用的な活用事例をご紹介します。ここで紹介するものは、あくまでも一部の事例です。工夫次第で、さまざまなシーンで利用できます。
- WEB記事の構成や原稿を生成する
- プログラムコードを生成する
- クラウド上のドキュメントファイルを要約する
- グラフや図を生成する
- 外国語を翻訳する
- 音声ファイルを文字起こしする
WEB記事の構成や原稿を生成する
ChatGPTを利用すると、WEB記事を作成するうえで役立ちます。具体的には、記事の構成や原稿を作成する際に参考として利用できます。ただし、原則的に、GPT-4oではリアルタイムで情報を取得しません。そのため、最新情報を扱う情報サイトを運用している場合は注意してください。
ChatGPTで最新情報にアクセスするためには、外部ツールのAPIとの連携、有料版のWEBブラウジング機能の利用といった方法が挙げられます。しかし、自動的にリアルタイムの情報を取得するものではありません。また、無料版のChatGPTでは、WEBブラウジング機能を利用できません。
このほか、カスタムGPTを使うと、適切なコンテンツを生成しやすくなります。カスタムGPTのストアには、次のようなライティング用のツールがアップロードされています。下記は、コンテンツ生成で役立つカスタムGTPの一例です。
追加ツール | ツールの特徴 |
---|---|
Write For Me | SEOを考慮したテキストを生成できる。タイトル、構成、パラグラフ文などの部品を生成するのに適している |
Scholar GPT | データ解析や推論力に秀でている。専門知識をもとにテキストや図表を生成するため、信頼性が高いコンテンツを生成するのに適している |
なお、東京SEOメーカー(本サイト)では、ChatGPTを活用して、SEOライティングで上位表示した事例を紹介する書籍を発行しています。興味がある方はチェックしてみてください。
プログラムコードを生成する
ChatGPTを用いて、プログラムコードやマークアップコードを生成できます。
たとえば、WEBサイトを運用していて、デザインを変更したいときは、CSSのマークアップコードを生成することになります。そこで、ChatGPTのチャットで「3カラムにするためのCSSとHTMLを生成して」などと打ち込むと、該当するマークアップコードを取得できます。下記は、カスタムGPTの一例です。
追加ツール | ツールの特徴 |
---|---|
Image to Code GPT | 画像データをもとに、CSSとHTMLのコードを生成できる |
Codey | コード生成からデバッグ、コードレビューまで、プログラミングで必要なタスク全般に対応している |
クラウド上のドキュメントファイルを要約する
ChatGPTでは、Google Drive、Microsoft OneDriveと連携することで、クラウド上のファイルにアクセスできます。
たとえば、Google Drive上のドキュメントファイルで社内用の資料を作成したとします。すると、ChatGPTでファイルを呼び出して、ファイルを交えてチャットできます。この機能を応用すると、ドキュメントファイルの内容を要約したり、スプレッドシートのデータをもとにグラフや図表を生成するといったことができます。
グラフや図を生成する
プロンプトでデータを指示しつつ指示文を伝えると、グラフや図表のファイル生成、データ解析といったことができます。
このうち、複雑なデータをグラフや図表で視覚化するタスクは、有料版限定の機能となります。また、データ解析自体は無料版でも可能ですが、その精度は有料版よりも劣りますので注意してください。
外国語を翻訳する
ChatGPTでは、外国語を翻訳することができます。生成AIの翻訳機能は、精度が高く、適切な表現で翻訳されやすい傾向にあります。このうち、英語、スペイン語など、WEB上で利用されることが多い言語ほど、翻訳の精度が高くなります。
翻訳の方法としては、プロンプトに外国語で書かれたテキストをペーストする、PDFやドキュメントファイルをアップロードするといった方法に分かれます。後者に関しては、有料版限定の機能となっています。
音声ファイルを文字起こしする
ChatGPTには、音声ファイルを直接的に文字起こしする機能はありません。しかし、OpenAI社が提供するWhisper APIを導入すると、有料版のChatGPT Plusで文字起こしができるようになります。
対応する音声ファイルは、MP3、MP4、MPEG、MPGA、M4A、WAV、WEBMの7形式です。さらに、ファイル容量は、25MB以下に限られます。ただし、Whisper APIの導入には、プログラミング言語のPythonの知識が求められます。導入を検討している方は、エンジニアに相談してください。
ChatGPT-4oの料金
ChatGPT-4oの料金モデルは全3種用意されています。一般的な生活で利用する分には、無料版でも十分に役立ちます。
プラン | 価格 / 採用するAIモデル / その他の機能 |
---|---|
無料
(Personal) |
価格 :無料
AIモデル:GPT-3.5、GPT-4o(回数制限あり) その他 :データ分析、ファイルアップデート、カスタムGPT(制限あり) |
Plus
(Personal) |
価格 :月額20ドル
AIモデル:GPT-3.5、GPT-4、GPT-4o(回数制限の大幅緩和) その他 :DALL-E(画像生成AI)、カスタムGPT(新規作成可)、新規機能のアクセス権 |
Team
(Business) |
価格 :月額25ドル(1人当たり)
AIモデル:GPT-4、GPT-4o(回数制限の大幅緩和) その他 :Plusの全機能、ワークスペース |
ChatGPTの無料版と有料版(Plus / Team)の違い
無料版のChatGPTと有料版のChatGPT Plusでは、できることが大幅に異なります。具体的には、2024年7月現在で、次のような点が異なります。
- GPT-4oの回数制限
- 応答時間の長さ(有料版が優先して処理される)
- ウェブブラウジング機能の利用可否
- データのグラフ化や図表化の可否
- 音声入力機能の利用可否
- DALL-E(画像生成AI)の利用可否
- カスタムGPTの新規作成の可否
一般的な生活のなかで利用する分には、無料版のChatGPTで十分に事足ります。ただし、業務上で大量の応答を利用するケースや高度な機能を使うためには、有料版のChatGPT Plusが必要です。さらに、Teamは、社内などのチームメンバー間でChatGPTを共有できるシステムが備わっています。
ChatGPT-4oのよくある質問
ChatGPT-4oに関する、よくある質問をまとめています。
Q:ChatGPTとはなんですか?
Answer)ChatGPT(チャットジーピーティー)とは、アメリカのOpenAI社が開発したAIチャーッとツールのことです。ユーザーは、チャットのフォームにプロンプトを入力して送信すると、AIが自動的に回答を提示してくれます。
関連記事:ChatGPTとは?始め方と使い方の解説とSEOコンサルタントによる簡単なAIアルゴリズムの検証
Q:ChatGPTとは、AIチャットツールとAIモデルのどちらですか?
Answer)ChatGPTはAIチャットツールです。そして、本ツールの応答を可能にしているものが生成AI(または大規模言語モデル)と呼ばれるAIモデルです。ChatGPTには、(2024年7月現在の)最新AIモデルのGPT-4oが搭載されています。
Q:ChatGPT-4oとは、サービス名のことですか?
Answer)正式なサービス名は、ChatGPT(有料版=ChatGPT Plus)です。ChatGPT-4oとは、「GPT-4oが搭載されたChatGPT」を指す際に用いられる通称です。
Q:ChatGPTの応答は、信頼できますか?
Answer)ChatGPTの応答内容は、信頼性が高いです。ただし、AIの誤認識で間違った情報を提示するケースがあります。また、原則的に、ChatGPTはWEBにアクセスすることなく、自己完結で回答を提示します(ウェブブラウジング機能でWEBアクセスは可)。そのため、古い情報を提示することが多々あります。
Q:ChatGPTのプロンプトとはなんですか?
Answer)ChatGPTにおけるプロンプト(Prompt)とは、ユーザー側がチャットで投げかける質問文や指示文のことです。もともと、プロンプトは、「促進」「促す」といった意味を表す英単語です。転じて、「回答を促すための質問文や指示文」という意味を持つAI用語として使われています。
Q:ChatGPTを利用するにあたって、おすすめのプロンプトは?
Answer)ChatGPTにおける、おすすめのプロンプトは、目的に応じて異なります。OpenAI社がプロンプトの事例を紹介していますので、参考にしてください。
参考(外部):プロンプトの例
また、東京SEOメーカー(本サイト)では、SEO対策に役立つプロンプトをまとめた記事を用意しています。あわせて参考にしてください。
関連記事:ChatGPTをSEO対策に活用する方法とは? おすすめプロンプト一覧もご紹介
このほか、SEO対策に関連する書籍を発行しています。ChatGPTを利用したSEOライティングのポイントをまとめています。
書籍URL(外部):ChatGPT×SEOライティング実践技術 ~東京SEOメーカーで実際に試した「AI新時代」の検索上位獲得術~
Q:GPT-5は、いつリリースされますか?
Answer)2024年7月現在のGPTにおける最新のAIモデルは、GPT-4oです。そして、GPT-5に関する情報は、OpenAI社から発信されていません。
ただし、噂レベルではWEB上でGPT-5に関して言及されています。東京SEOメーカーでも、GPT-5に関する予測記事を公開していますので、興味があればチェックしてみてください。
まとめ