GPT-5とは?リリース時期予想やメリットを解説
人工知能(AI)と自然言語処理(NLP)の分野においては、新たな進歩が日々目まぐるしく起こっています。その中でもいま、GPT-5(Generative Pre-trained Transformer 5)という新たなAIモデルが登場することが注目されています。
GPT-5は前世代のモデルであるGPT-4からさらなる進化を遂げたものです。さまざまな分野での自然な対話や文章生成において、より高度な性能を提供することが期待されています。そのため開発者や研究者たちはGPT-5を、さらに洗練されたコンテンツ生成、情報検索、市場革新、教育などの分野で応用する計画を進めています。
GPT-5とは
GPT-5とは、ChatGPTでおなじみ「OpenAI」社が運営する、最新の技術を搭載した次世代AIモデルのことです。
本記事執筆時点(2023年11月)現在では、ChatGPTの最新のAIモデルは「GPT-4」です。つまりGPT-5とは、まだリリースされていない未来のバージョンのことを指しています。
これまでのChatGPTのバージョンとリリース時期は、次のとおりです。
バージョン名 | リリース時期 |
GPT-1 | 2018年6月 |
GPT-2 | 2019年2月 |
GPT-3 | 2020年6月 |
GPT-3.5 | 2022年3月 |
GPT-4 | 2023年3月 |
GPT-5 | 2024~2025年(予想) |
GPT-5のリリース時期についてはまだ正式に公開されていませんが、2024~2025年に実現すると予想されています。
GPT-4との違い
2023年3月に発表されたChatGPTのフラッグシップである「GPT-4」は、以前のバージョンに比べて大幅なアップデートを施し、話題となりました。
GPT-3.5からGPT-4で変わった進化として、具体的に次のようなものが挙げられます。
- 対応する文量が1,500ワードから25,000ワードに拡大
- 高度なプログラムコード生成に対応
- あらゆる言語の高度な翻訳に対応
- 小説や小論文などの高度なコンテンツ制作に対応
- 画像の表示に対応
大きな利便性と実用性の向上から、そのシンギュラリティを大きく評価されました。
しかしGPT-5では、上記のような「文章生成」の分野を逸脱し、
- 画像や動画の読み込み・生成
- 個々のデータのインプット
- 感情的な振る舞い
- 人型ロボットの原動力としての搭載
などに対応することが予測されています。
特定の個人、また業界やタスクに合わせてモデルをカスタマイズする能力も向上するため、より多様化していくニーズに沿った使い方が、容易に実現できます。
2023年7月GPT‐5の商標を正式に申請
2023年7月、OpenAI社は「GPT-5」の商標を、アメリカの特許商標庁に申請したことが報じられました。
これにより現段階の最新フラッグシップ「GPT-4」が、「GPT-5」としてより便利で実用的にアップデートされる可能性がさらに濃厚になっています。
その主な申請内容は、以下のとおりです。
- ダウンロード可能な、言語モデル用ソフトウェア
- テキストおよび音声を自動生成するためのソフトウェア
- ダウンロード可能な、自然言語の理解と生成を行うコンピュータープログラム
OpenAI社は現段階では、GPT-5に関する情報はとくに開示してないため、詳しいアップデート内容は定かではありません。
ただ現状、アメリカIT大手「META」社などは、文字よりも音声や動画に前のめりな姿勢を見せています。この動向からOpenAI社もそれに対抗すべく、これまで同様テキストの生成はもちろん、音声や自然言語に対応する可能性も期待されています。
GPT-5がリリースされるのは?【2024~2025年】
そのリリース時期についての確定的な情報はありませんが、継続的な研究と開発が進行中で、数年以内に登場する可能性が高いと言われています。
GPT-5で期待されているアップデートの内容
GPT-5へのアップデートで実現が期待される内容としては、次のようなものがあります。
- 個々の情報やデータをインプットできる
- 動画などのコンテンツを扱えるようになる
- 感情をもった振る舞いが可能になる
- さまざまな市場に対して変革をもたらす
- 人型のロボットの原動力として搭載される可能性がある
個々の情報やデータをインプットできる
GPT-5では、個々の情報およびデータをインプットできるようになることが期待されています。現段階のChatGPTは、たとえば家族構成や趣味嗜好のような「個々人に向けての回答」は不可能です。
しかし現在ChatGPTは開発者向けに、「Fine-Tuning」というAPIを公開しています。これはChatGPTに対し、任意で入れたいデータや情報をインプットできるという内容のものです。
たとえば任意の家族構成、友人との相関関係、職業や趣味嗜好などのデータをChatGPTに入力することで、より親密な回答を返してくれるようになります。
GPT-5ではこの技術が応用される可能性が高く、ユーザーのスケジュールを管理するなど、秘書のような振る舞いをしてくれます。またリアルな人間関係や恋愛相談などに乗ってくれる、家族同様のバーチャルアシスタントのような存在になることが期待されています。
動画などのコンテンツを扱えるようになる
GPT-4では文章をはじめ、翻訳やプログラミングなどのテキスト生成、また画像データの扱いに関する大幅な進化が着目されました。
しかしこれからのGPT-5では、動画などのコンテンツに対する機能が進化していくと予想されています。
具体的には、「テキスト情報だけで動画を作成する機能」が搭載される可能性が高いということです。たとえば「絵を描いているペンギンの動画」などと入力すれば、それに該当するGIF動画などを瞬時に制作してくれる機能などが挙げられます。
OpenAIのCEOであるサム・アルトマン氏は以前、「私はビデオで何が実現できるかが楽しみです。世の中はテキストよりも、ビデオコンテンツのほうが学びやすいことが多いです。」とコメントしています。
現に「テキスト情報をもとに画像や動画を生成するAI」は存在します。CEOの方針からも、GPT-5がこういった機能を搭載する可能性は極めて高いです。
感情をもった振る舞いが可能になる
GPT-5では、「感情をもった振る舞い」が可能になると期待されています。
GPT-3からGPT-4へのアップデートでは、パラメーター数(データ量)が約160倍と、圧倒的に増えたことが大きな話題となりました。この背景から、GPT-4からGPT-5へのアップデートでは、同等かそれ以上のパラメーター数の増加が期待されています。
大きなパラメーター数増加を実現したGPT-5は、
- 個々に対するパーソナライぜーションの実現
- テキストや画像のみならず、動画や3Dデータの取扱
- 人間のような「感情」をもった振る舞いの実現
といった機能をもつのではないか、と期待されているわけです。
感情をもったAIモデルが完成すれば、「より人間らしいAIモデル」が実現します。ゲームでたとえるならRPGのキャラクターが何度も同じセリフを繰り返すことがなくなったり、スポーツゲームの実況がより生身の人間に近いものになったりするということです。
さまざまな市場に対して変革をもたらす
GPT-5はあらゆる市場に対し、大きな変革をもたらすことが予測されています。その中でもとくに注目が集まっているのが、金融業界、医療業界、科学分野です。
たとえば医療業界における、「レントゲン写真を確認して病気を検出するA」。すでに現段階で、医師よりも判断が的確とされています。また現在リリースされているGPT-4は、弁護士試験や医療試験にも合格できるほどの頭脳をもっています。
化学分野においても膨大なデータをもとに実験が行われることから、今後AIが代替する可能性が高いです。また金融業界においても、データの蓄積によってトレーディングのアルゴリズムや、不正・リスクへの対策が強化されていくとされています。
人型のロボットの原動力として搭載される可能性がある
GPT-5は、人型のロボットの原動力として搭載されることも期待されています。つまりGPT-5がロボットの頭脳となって、ユーザーの命令を聞いたり会話が可能になるということです。
その根拠としてOpenAI社は2023年3月、人型ロボットを開発している「1X」という企業に、2300万ドルの投資を行っています。こういった背景から、ロボットが生身の人間のように2足歩行で、家事や仕事を行ったりする日はそう遠くはありません。
これからリリースされるGPT-5がどれほどの機能を実現するかは、現段階では未知数です。ただ、人型ロボットにAIモデルが搭載されることで、
- 介護業界の人手不足の解消
- オフィスの警備員の代わりを担う
- 冷蔵庫の中身を検知し自動で料理を行う
- 自宅やオフィスの掃除を全自動で行う
また人型ロボットのマーケット規模は、2032年までに4兆円にまでのぼるとされています。現在ではOpenAIのみならず、自動車大手「Tesla」社なども、人型ロボット開発に前のめりな姿勢を見せているのが現状です。
まとめ