2024年5月13日にCPT-4oが公開されました。

「人間の会話と同じ速度で実行できる」と言われており、精度も大幅にアップしていると言われています。
弊社スタッフも試してみたところ、凄まじい速度で答えが返ってきてくることを確認できました!

画像認識の精度も上がったことで
・画像の文字起こし
・制作物のテストやエラーチェック
・コーディングの高速化
など、さまざまな活用方法を模索しています。

今回は、試していた中で、GPT3.5から特に変わったと思う部分を紹介したいと思います!

1.比較的新しい情報に対する回答

GPT-3.5の場合

GPT-3.5は「2022年1月」までの情報を学習しているようです。


そのため、それ以降の情報には答えてくれません。
Llamaについて聞いてみても、そっけない態度で返されてしまいました…

GPT-4oの場合

GPT-4oは「2023年10月」までの情報を学習しているようです。

Llamaについて聞いてみると、
こちらでは前提条件・手順から解説してくれています。

2022年以降に出てきた情報について調べる場合には、GPT-4oの利用を検討してみると良いかもしれません。

2.テキスト付画像の生成

既存の画像をベースに、テキスト付の画像を作ってもらいます。

【プロンプト】

このキャラクターの画像を、アニメーション風によりかわいく再生成してください。 再生成する際に、構図・ポーズや髪の毛や服の色は、あまり変更しないようにしてください。 また、「AI Game Changer」という文字を入れて、ポスター画像として完成させてください。 画像サイズは1024×1024で出力してください。


【画像】

なお、GPT-3.5は画像の取り込み・生成ができないため、Copilotと比較してみました。

Copilotの場合


文字は出力してくれましたが、元のイラストとは大分異なっている印象です。

GPT-4oの場合

髪の毛や服の色が多少変わっていたりしますが、ある程度は元の人物の特徴を捉えていそうな気はします。
文字については「change」のスペルが間違っていますね。
とは言え、プロンプトを調整すればもっと良くなりそうです。

なお、ダウンロードした画像ファイル名に画像生成のプロンプトが記載されており、
「A cute anime-style girl with gray cat ears and long gray hair, wearing a white blouse with frills and a black bow, and a black skirt」となっていたので、
アップロードした画像から、画像生成プロンプトを再生成しているのかもしれません。


※なお、日本語での生成も試してみましたがうまくいきませんでした。
プロンプトを無視することも何度かあったため、
画像を作成するという目的では、画像生成AIであるMidjourneyに分があると言えるかもしれません。

無料で使う方法

無料でGPT-4oを使用する方法ですが、
実は何も設定しなくても自動的にGPT-4oで回答してくれるようになっており、
一定回数を使用すると、GPT-3.5での回答に変更されるという感じになっています。

では、回答内容がGPT-4oになっているのかを確認する方法ですが、
回答文の右下のアイコンをクリックします。

GPT-4oにチェックが付いていれば、GPT-4oが使用できているという事になります。



一定回数を超えると、下記画像のように通知が来るようになっており、
その時間まではGPT-3.5で回答されるようになっています。


何度も利用したい、という方はプラン変更を検討しましょう!