【シリコンバレー=渡辺直樹】対話型AI(人工知能)「Chat(チャット)GPT」を手がける米新興企業のオープンAIは13日、新型AI「GPT-4o(フォーオー)」を開発したと発表した。従来に比べて処理スピードを2倍に高速化した一方、運用コストを半減した。声で話しかけると、ヒトと同じ反応速度で会話ができる。弱点だった反応の遅延を克服し、AIの活用がさらに広がりそうだ。
開発した「GPT-4o」はチャットGPTを動かす基盤となる技術で、刷新は2023年11月に発表した現行の「GPT-4ターボ」以来となる。oは「すべての」を意味する「オムニ」の頭文字から取った。
新しいAIは日本語を含む50の言語に対応し、文字、画像、音声をすべて認識する。リアルタイム翻訳のほか、スマートフォンのカメラを使って人の顔の表情を読み取ったり、グラフを読み取ったりすることもできる。
AIの音声への反応速度は速い場合は232ミリ秒(1000分の1秒)、平均で320ミリ秒と、ヒトが実際に会話する時と同じレベルを実現したという。ヒトの感情を読み取り、ジョークも通じる。より自然な会話が可能になったとしている。
同日開いたウェブ発表会のデモでは、開発者が音声で、チャットGPTに就寝前にそぐう格好で物語を読み聞かせるように依頼した。声のトーンを劇画調にする、歌いながら読ませるといった操作を披露した。
ミラ・ムラティ最高技術責任者(CTO)は発表会で「これまで(AI)モデルの知能を高めることに注力してきたが、使いやすさで大きな前進を遂げた」と強調した。
新技術の搭載後もチャットGPTの基本料金は変わらない。テキストや画像向けの一部機能のみ無料で使える。音声を使用した機能は月20ドルの有料課金利用者や法人向けには先行して、数週間以内に使えるようにする。データ運用の負荷を避けるため、利用回数にはプランに応じて制限がある。
生成AIは米グーグルの「Gemini(ジェミニ)1.5Pro」、米スタートアップのアンソロピックが開発した「Claude(クロード)3」、米メタの「Llama(ラマ)3」など新技術投入が相次ぎ、性能競争が激しくなっている。
オープンAIは高精細の動画をつくる生成AI「Sora(ソラ)」も開発している。AIが処理できる情報量や種類を増やしており、処理速度を速めてさらに使い勝手をよくすることで、1億人以上が利用するチャットGPTのサービスでさらに地歩を固める。
チャットGPTはAPIと呼ばれ異なるシステム間でデータをやり取りする仕組みにも対応している。利用企業はオープンAIの新しい音声会話の仕組みを今後自社ソフトに取り入れ、新しいサービスを開発することにつなげることができる。
【関連記事】
- ・OpenAI、「GPT-4ターボ」発表 長文処理や画像認識
- ・OpenAIが動画生成モデル「Sora」公開 文章で指示
- ・女子高生、ネコ…米OpenAIがつくった日本の生成AI動画
- ・OpenAI、大企業向けChatGPT データ保護で使いやすく
- ・OpenAI、人の声を再現する生成AI「Voice Engine」開発
鄭重声明:本文の著作権は原作者に帰属します。記事の転載は情報の伝達のみを目的としており、投資の助言を構成するものではありません。もし侵害行為があれば、すぐにご連絡ください。修正または削除いたします。ありがとうございます。