株式会社バレンサー

GPT-4oとは?最先端モデルがなんと無償提供!音声も映像も通訳も!

SHARE ON
Facebook
Twitter
Pinterest
TAG
カテゴリー
CONTACT US

INDEX

GPT-4oとは?最先端モデルがなんと無償提供!音声も映像も通訳も!

OpenAIは5月13日に開催した春のアップデートイベントで、AI技術の新たな進展を発表しました。

このイベントでは、新しいGPT-4oモデルが無料版と有料版のChatGPTに導入されることが明らかにされ、AI技術の多様な活用方法が示されました。

GPT-4oモデルは、音声、画像、動画を解析できるマルチモーダル機能を持ち、より自然で感情豊かな音声アシスタントを提供します。

また、無料ユーザー向けにもカスタムGPTやデスクトップアプリなど、従来の使いづらさを一気に解消してくれそうな新機能が多数追加される予定です。

今回の記事は速報版として、具体的にどんな発表があったのかをご紹介します。

新機能の詳細解説

1. GPT-4oモデルの特徴

マルチモーダル機能

GPT-4oは音声、画像、動画の解析が可能なマルチモーダルモデルです。この機能により、ユーザーはさまざまな形式のデータを利用してChatGPTとやり取りできます。

高効率なパフォーマンス

GPT-4oは前バージョンに比べて効率が大幅に向上しており、無料ユーザーでもより多くのリクエストを処理できます。これにより、よりスムーズな体験が提供されます。

2. 無料ユーザー向けの新機能

カスタムチャットボット

初めて無料ユーザーにもカスタムチャットボットが提供されます。これにより、ユーザーは自身のニーズに合わせてチャットボットをカスタマイズし、より個別化された応答を得ることが可能です。

デスクトップアプリのリリース

新たにリリースされるデスクトップアプリは、音声モードや視覚機能を搭載しており、より豊かな体験が可能です。これにより、PC上でもモバイル版と同様の機能を利用できます。

3. 音声アシスタントの強化

自然で感情的な応答

新しい音声アシスタントは、より自然で感情的な応答が可能です。これにより、ユーザーはより人間らしい対話を楽しむことができます。例えば、デモでは「あなたの良い気分の理由を共有したいですか?」といった感情に寄り添う応答が示されました。

またデモの中ではGPTを切り忘れていたところに「そういえば、その服お似合いですね」と、プレゼンター同士の会話に割って入るシーンもありました。

リアルタイム翻訳

音声アシスタントはリアルタイムでの翻訳機能を持ち、旅行者や多言語環境での利用が大幅に便利になります。デモでは、イタリア語を英語に、英語をイタリア語にリアルタイムで翻訳する機能が紹介されました。

4. 視覚機能の強化

カメラによる解析

ChatGPTはカメラを通じて画像や動画を解析する機能を持っています。これにより、手書きの方程式をカメラで読み取ってステップバイステップで解答を提示したり、デスクトップの画面を解析してフィードバックを提供したりすることが可能です。

感情認識

ChatGPTはカメラを通じてユーザーの表情を解析し、感情を認識することができます。例えば、笑顔の画像を見た際に「ご機嫌ですね、何かいいことありました?」と問いかける機能がデモで示されました。

5. 教育用途での活用

コード解析

ChatGPTはコードをリアルタイムで解析し、潜在的な問題を指摘したり、改善点を提案したりすることができます。これにより、プログラマーや学生にとって強力な学習ツールとなります。

学習サポート

デモでは、手書きの方程式をカメラで読み取り、解答を提供する機能が紹介されました。このような機能は、学生が学習課題を効率的に解決するのに役立ちます。

6. その他の注目ポイント

音声での物語作成

音声アシスタントは、ユーザーの指示に応じて物語を作成する機能も持っています。これにより、ユーザーは物語を聞くだけでなく、自分の希望に沿ったストーリーを生成することができます。

ドラマチックな音声

音声アシスタントは、単に情報を伝えるだけでなく、感情を込めた表現も可能です。デモでは、ドラマチックな語り口や歌声など、さまざまな声色を使って物語を語る機能が紹介されました。

特に歌が歌えるというのは衝撃的ですね。感情についてもリクエストしながら歌のボーカルを作る事ができるのはいまのところsunoでもできません。(sunoはポン出しのみなので)

まとめ

OpenAIの春のアップデートイベントでは、多くの新機能と改良が発表されました。

個人的に一番嬉しいのはカスタムGPTが無料ユーザーにも使えるようになることで、これにより特定用途向けに作ったものの一般配布なども考えられるようになります。

また、実際に使ってみて意外に嬉しかったのがその速さ。GPT4と比べると段違いに速く、読むスピードが追いつきません。

マルチモーダルの部分に関しても実際に試さないとわからない部分があるので、色々実験したいと思います。


 

*この記事は生成AIによって半自動的に生成しています。

大好評!「マーケティングのための生成AI活用大全」のダウンロードはこちらから

限定無料DL!電子書籍:マーケティングのための生成AI活用大全

 

弊社ではChatbotの開発や生成AIを活用した記事作成なども行っています。弊社の具体的な事例もありますのでご興味がある方はこちらからご覧ください。

生成AIを活用した、弊社のChatbot・ウェブサービスの事例集

 

LATEST ARTICLE

最新記事