原文 げんぶん と比 くら べた結果 けっか 、この記事 きじ には多数 たすう の(または内容 ないよう の大 だい 部分 ぶぶん に影響 えいきょう ある)誤訳 ごやく があることが判明 はんめい しています。情報 じょうほう の利用 りよう には注意 ちゅうい してください。 正確 せいかく な表現 ひょうげん に改訳 かいやく できる方 ほう を求 もと めています。 (2024年 ねん 6月 がつ )
GPT-4o (GPT-4 Omni ) は、OpenAI によって作 つく られた多言 たげん 語 ご 対応 たいおう かつマルチモーダル (英語 えいご 版 ばん ) なGPT である。
2024年 ねん 5月 がつ 13日 にち の配信 はいしん でOpenAIのCTOであるミラ・ムラティ によって発表 はっぴょう され、その日 ひ にリリースされた[ 1] 。
GPT-4oは無料 むりょう で使用 しよう することができるが、制限 せいげん が存在 そんざい する。ChatGPT Plusのユーザーは、制限 せいげん が5倍 ばい に緩和 かんわ される[ 2] 。
GPT-4oはテキスト、画像 がぞう 、音声 おんせい を入力 にゅうりょく および生成 せいせい することが可能 かのう である[ 3] 。
API では、GPT-4 Turbo の半分 はんぶん の価格 かかく で2倍 ばい の速度 そくど で使用 しよう できる[ 1] 。
音声 おんせい 入力 にゅうりょく には最短 さいたん 232ミリ秒 びょう で応答 おうとう でき、平均 へいきん 320ミリ秒 びょう で人間 にんげん の応答 おうとう 時間 じかん に近 ちか い応答 おうとう が可能 かのう である[ 4] 。
もともと、GPT-4oはLarge Model Systems Organization's (LMSYS ) のチャットボットとして、gpt2-chatbot、im-a-good-gpt2-chatbot、im-also-a-good-gpt2-chatbotの3つの異 こと なるモデルとしてひそかにリリースされた[ 5] 。
2024年 ねん 5月 がつ 7日 にち には、サム・アルトマン は「im-a-good-gpt2-chatbot」とツイート した。これは、これらのモデルがA/Bテスト されている新 あたら しいモデルであることの確認 かくにん として解釈 かいしゃく された[ 6] 。
GPT-4oは、音声 おんせい 、多言 たげん 語 ご 、画像 がぞう 認識 にんしき ベンチマークで最先端 さいせんたん の結果 けっか を達成 たっせい し、また音声 おんせい 音声 おんせい 認識 にんしき と翻訳 ほんやく に関 かん する分野 ぶんや で新 しん 記録 きろく を樹立 じゅりつ した[ 7] [ 8] 。また、GPT-4oは、Massive Multitask Language Understanding(MMLU)ベンチマークで88.7というスコアを取得 しゅとく した。GPT-4は86.5である[ 9] 。
GPT-3.5やGPT-4は、音声 おんせい 認識 にんしき をする際 さい に異 こと なるモデルを使用 しよう している。一方 いっぽう GPT-4oは言語 げんご モデルとしてvoice-to-voiceに対応 たいおう しているため、応答 おうとう をほぼより速 はや く生成 せいせい することができる[ 9] 。しかし、サム・アルトマン は2024年 ねん 5月 がつ 15日 にち に、GPT-4oのこの機能 きのう はまだChatGPTに搭載 とうさい されていないため、従来 じゅうらい の方法 ほうほう が使用 しよう されている可能 かのう 性 せい があるとした[ 10] 。
GPT-4oは50以上 いじょう の言語 げんご に対応 たいおう していて[ 1] 、これは世界 せかい の言語 げんご 話者 わしゃ の97%以上 いじょう に及 およ んでいるとOpenAIは主張 しゅちょう している[ 11] 。ミラ・ムラティは、2024年 ねん 5月 がつ 13日 にち のOpenAIの配信 はいしん において、モデルにイタリア語 ご を伝 つた え、それを英語 えいご とイタリア語 ご に翻訳 ほんやく することで、モデルの多言 たげん 語 ご 能力 のうりょく を実証 じっしょう していた。
さらに、GPT-4oの新 あたら しいトークナイザーは、特 とく にラテンアルファベットに基 もと づいていない言語 げんご などに使用 しよう するトークンが少 すく ないという特徴 とくちょう がある。そのため、それらの言語 げんご を使用 しよう するときのコストを抑 おさ えることができる[ 9] 。
GPT-4oは2023年 ねん 10月 がつ までの学習 がくしゅう データを保有 ほゆう している[ 12] [ 13] 。さらに、12万 まん 8000 (128k) トークンのコンテキスト長 ちょう に対応 たいおう していて、[ 12] また2048トークンまでを出力 しゅつりょく できる[ 13] 。
2024年 ねん 5月 がつ 現在 げんざい 、カルフォルニア大学 だいがく バークレー校 こう のLarge Model Systems Organization (LMSYS) イロレーティング ベンチマークに含 ふく まれている[ 14] 。
GPT-4oの声 こえ として、Breeze、Cove、Ember、Juniper、Skyを提供 ていきょう した。リリースされた後 のち にこのうちのSkyの声 こえ が、 スカーレット・ヨハンソン に似 に ているとされた。5月14日 にち 、エンターテインメント・ウィークリー誌 し は、この類似 るいじ 点 てん は意図 いと 的 てき なものなのかどうかを記述 きじゅつ した[ 15] 。2024年 ねん 5月 がつ 18日 にち には、ヨハンソンの夫 おっと であるColin Jostが、 サタデー・ナイト・ライブ でそれに関 かん するジョークを言 い った[ 16] 。5月20日 にち 、OpenAIはSkyを無効 むこう にし、「ChatGPT、特 とく にSkyの声 こえ をどのように学習 がくしゅう したかについて質問 しつもん をもらった。私 わたし たちは、それらに対処 たいしょ しながら、Skyの使用 しよう を一時 いちじ 停止 ていし している」と声明 せいめい を出 だ した[ 17] 。
スカーレット・ヨハンソンは、2013年 ねん にスパイク・ジョーンズのSF映画 えいが 「Her」に主演 しゅえん し、女性 じょせい の声 こえ の賢 かしこ いバーチャルアシスタントであるサマンサを演 えん じた。
GPT-4oのリリースの前 まえ のプロモーションの一環 いっかん として、サム・アルトマンは5月13日 にち に「Her」とをツイートした[ 18] [ 19] 。
OpenAIは、それぞれの声 こえ は雇 やと われた声優 せいゆう によるものだと主張 しゅちょう し、具体 ぐたい 的 てき には、「スカイの声 こえ はスカーレット・ヨハンソンの真似 まね ではなく、別 べつ のプロの声優 せいゆう が声優 せいゆう 自身 じしん の自然 しぜん な話 はな し声 ごえ を使 つか って作 つく ったものだ」と主張 しゅちょう した[ 17] 。OpenAIはすでに2023年 ねん 9月 がつ に、ChatGPTアシスタントの近々 ちかぢか 登場 とうじょう する新 あたら しい会話 かいわ バージョンはスカーレット・ヨハンソンに似 に せることを意図 いと したものではないと主張 しゅちょう した。
CTOのミラ・ムラティ氏 し は、その声 こえ について分 わ からないので、実際 じっさい にスカーレット・ヨハンソンの声 こえ を聞 き きに行 い かなければならなかったと述 の べた。OpenAIはさらに、ヨハンソンに連絡 れんらく する前 まえ に声優 せいゆう を募集 ぼしゅう したと主張 しゅちょう した[ 20] [ 19] 。
この事件 じけん に対 たい して人々 ひとびと は、ヨハンソンが以前 いぜん 、マーベル映画 えいが 『ブラック・ウィドウ 』のストリーミング配信 はいしん をめぐる契約 けいやく 違反 いはん でウォルト・ディズニー社 しゃ を訴 うった えて和解 わかい した経緯 けいい との類似 るいじ 点 てん を指摘 してき した。この和解 わかい でヨハンソンは4000万 まん ドルほどを手 て にしたと推測 すいそく されている[ 21] [ 22] 。
また、5月21日 にち にはワシントンポストのShira Ovide記者 きしゃ がテクノロジー企業 きぎょう による「most bone-headed self-owns」(最 もっと も間抜 まぬ けな自己 じこ 所有 しょゆう )のリストを発表 はっぴょう し、ヨハンソンの不 ふ 同意 どうい にもかかわらずヨハンソンに似 に た声 こえ を採用 さいよう し、その後 ご 類似 るいじ 点 てん を否定 ひてい した決定 けってい は6位 い にランクされた[ 20] 。5月24日 にち 、ポリティコ のデレク・ロバートソン氏 し は「massive backlash(大 だい 規模 きぼ な反発 はんぱつ )」について書 か き、「世界 せかい で最 もっと も有名 ゆうめい な映画 えいが スターの一人 ひとり の声 こえ を盗用 とうよう することは、 AI への過度 かど の依存 いぞん についての警告 けいこく となるこの映画 えいが に関連 かんれん しているが、すぐに世論 せろん をサム・アルトマン氏 し の主張 しゅちょう に引 ひ き戻 もど すのに役立 やくだ つ可能 かのう 性 せい は低 ひく い」と結論 けつろん 付 つ けた[ 23] 。
^ a b c Wiggers (2024年 ねん 5月 がつ 13日 にち ). “OpenAI debuts GPT-4o 'omni' model now powering ChatGPT ” (英語 えいご ). TechCrunch . 2024年 ねん 5月 がつ 13日 にち 閲覧 えつらん 。
^ Field (2024年 ねん 5月 がつ 13日 にち ). “OpenAI launches new AI model GPT-4o and desktop version of ChatGPT ” (英語 えいご ). CNBC . 2024年 ねん 5月 がつ 14日 にち 閲覧 えつらん 。
^ Claburn. “OpenAI unveils GPT-4o, a fresh multimodal AI flagship model ” (英語 えいご ). The Register . 2024年 ねん 5月 がつ 18日 にち 閲覧 えつらん 。
^ “Hello GPT-4 ”. OpenAI . 2024年 ねん 6月 がつ 8日 にち 閲覧 えつらん 。
^ Edwards (2024年 ねん 5月 がつ 13日 にち ). “Before launching, GPT-4o broke records on chatbot leaderboard under a secret name ” (英語 えいご ). Ars Technica . 2024年 ねん 5月 がつ 17日 にち 閲覧 えつらん 。
^ Zeff (2024年 ねん 5月 がつ 7日 にち ). “Powerful New Chatbot Mysteriously Returns in the Middle of the Night ” (英語 えいご ). Gizmodo . 2024年 ねん 5月 がつ 17日 にち 閲覧 えつらん 。
^ van Rijmenam (13 May 2024). “OpenAI Launched GPT-4o: The Future of AI Interactions Is Here ”. The Digital Speaker . 17 May 2024 閲覧 えつらん 。
^ Daws (2024年 ねん 5月 がつ 14日 にち ). “GPT-4o delivers human-like AI interaction with text, audio, and vision integration ” (英語 えいご ). AI News . 2024年 ねん 5月 がつ 18日 にち 閲覧 えつらん 。
^ a b c “Hello GPT-4o ”. OpenAI . 2024年 ねん 6月 がつ 7日 にち 閲覧 えつらん 。
^ “OpenAI GPT-4o: How to access GPT-4o voice mode; insights from Sam Altman” . The Times of India . (2024年 ねん 5月 がつ 16日 にち ). ISSN 0971-8257 . https://timesofindia.indiatimes.com/technology/tech-news/watch-samsung-makes-fun-of-apple-says-we-would-never-crush-creativity/articleshow/110172573.cms 2024年 ねん 5月 がつ 18日 にち 閲覧 えつらん 。
^ Edwards (2024年 ねん 5月 がつ 13日 にち ). “Major ChatGPT-4o update allows audio-video talks with an “emotional” AI chatbot ” (英語 えいご ). Ars Technica . 2024年 ねん 5月 がつ 17日 にち 閲覧 えつらん 。
^ a b “Models - OpenAI API ”. OpenAI . 17 May 2024 閲覧 えつらん 。
^ a b Conway (2024年 ねん 5月 がつ 13日 にち ). “What is GPT-4o? Everything you need to know about the new OpenAI model that everyone can use for free ” (英語 えいご ). XDA Developers . 2024年 ねん 5月 がつ 17日 にち 閲覧 えつらん 。
^ Franzen (2024年 ねん 5月 がつ 13日 にち ). “OpenAI announces new free model GPT-4o and ChatGPT for desktop ” (英語 えいご ). VentureBeat . 2024年 ねん 5月 がつ 18日 にち 閲覧 えつらん 。
^ Stenzel (May 14, 2024). “ChatGPT launching talking AI that sounds exactly like Scarlett Johansson in 'Her' — on purpose? ” (英語 えいご ). Entertainment Weekly . 2024年 ねん 5月 がつ 21日 にち 閲覧 えつらん 。
^ Caruso (2024年 ねん 5月 がつ 20日 はつか ). “Scarlett Johansson Says She Was ‘Shocked, Angered and in Disbelief’ After Hearing ChatGPT Voice That Sounds Like Her — Read Statement ” (英語 えいご ). TVLine . 2024年 ねん 5月 がつ 21日 にち 閲覧 えつらん 。
^ a b “How the voices for ChatGPT were chosen ”. OpenAI (May 19, 2024). 2024年 ねん 6月 がつ 7日 にち 閲覧 えつらん 。
^ “her ”. X (formerly Twitter) (May 13, 2024). 2024年 ねん 5月 がつ 21日 にち 閲覧 えつらん 。
^ a b Allyn, Bobby (May 20, 2024). “Scarlett Johansson says she is 'shocked, angered' over new ChatGPT voice” . NPR . https://www.npr.org/2024/05/20/1252495087/openai-pulls-ai-voice-that-was-compared-to-scarlett-johansson-in-the-movie-her
^ a b Ovide, Shira (30 May 2024). “Perspective | Exactly how stupid was what OpenAI did to Scarlett Johansson?” . Washington Post . https://www.washingtonpost.com/technology/2024/05/21/chatgpt-voice-scarlett-johansson/
^ “Scarlett Johansson took on Disney. Now she’s battling OpenAI over a ChatGPT voice that sounds like hers ” (英語 えいご ). Yahoo Finance (2024年 ねん 5月 がつ 21日 にち ). 2024年 ねん 5月 がつ 21日 にち 閲覧 えつらん 。
^ Pulver, Andrew (2021年 ねん 10月 がつ 1日 にち ). “Scarlett Johansson settles Black Widow lawsuit with Disney” (英語 えいご ). The Guardian . ISSN 0261-3077 . https://www.theguardian.com/film/2021/oct/01/scarlett-johansson-settles-black-widow-lawsuit-disney 2024年 ねん 5月 がつ 21日 にち 閲覧 えつらん 。
^ “Sam Altman’s Scarlett Johansson Blunder Just Made AI a Harder Sell in DC - POLITICO ”. 2024年 ねん 6月 がつ 7日 にち 閲覧 えつらん 。