OpenAI は 、GPT-4o の発表後、すでに最初の大きな論争に直面しています。この高度な言語モデルの主な魅力はスピーチの使用と流暢な会話ですが、スカーレット・ヨハンソンの声をコピーしていると非難された後、その最も人気のある声を削除したばかりです。女優はコメントしていないが、会社の動きはハリウッド出身の彼女からの苦情の可能性が先行していると主張する人たちがすでにいる。
この論争はスカイを中心に展開しており、その声は女優の口調に信じられないほど似ていると多くの人が言っている。現時点では、これらはユーザーによる推測や発言ですが、OpenAI はすでにソーシャル ネットワーク上で、この音声オプションを言語モデルから削除することを確認しています。
実際、同社はGPT-4o の声をどのように選択したかを明らかにし、 Sky が女優の声を模倣していないことを明らかにすることで手を洗いたかったのです。さらに、OpenAI によれば、その声は現実の人々のものだという。
私たちは、AI の声が有名人の特徴的な声を故意に模倣すべきではないと信じています。スカイの声はスカーレット・ヨハンソンの模倣ではなく、むしろ彼女自身の自然な声を使った別のプロの女優のものです。
OpenAI ブログ
ChatGPTの音声は本物です
OpenAIはコピーではないことを確認した後、音声の選択プロセスがどのようなものであったかを明らかにした。そして最も重要なことは、それらは決して人工知能プログラムで作成されていないということです。彼らは ChatGPT と GPT-4o を自然なものにしたいと考え、モデルの声を選択する際の品質基準を得るために、受賞歴のあるキャスティング ディレクターとプロデューサーを採用しました。
このチームは 2023 年 5 月にキャスティング コールを開始し、プロの吹き替え俳優や映画俳優の 400 人以上の声を研究したことに注意してください。最終的に選ばれたのは、現在 GPT-4o 音声システムに命を吹き込んでいる 5 つの音声です。これらのオプションの中には、物議を醸したコピーであるSkyがありました。
選考から数か月後、これらの人々はサンフランシスコに飛び、レコーディングセッションを実施し、チームとともに言語モデルの可能性を研究しました。 OpenAIは、このプロセスが約5か月続き、専門家が吹き替え部門で確立されている料金をはるかに上回る料金を請求したことを確認した。
したがって、スカーレット・ヨハンソンの声のコピーとされるスカイが実在の人物のものであり、直接的な関係を確立するために適切なトーンを選択した AI ベースのシステムが存在しないことをすべてが示しています。現在、 OpenAI が彼女を女優に似ているという理由で選んだのかどうかを知ることはできません。
同社はプライバシーを保護するためにスカイの声を担当する人物の身元を明らかにしたくなかったので、論争は空中に留まり、OpenAIの言葉は、非常に興味深いものではあるが、対照することはできない。
OpenAIはSkyを殺し、4つの声を維持する
この一連の話は OpenAI にとって役に立たなかったようで、OpenAI は追って通知があるまで、あまり説明もせずにSky の音声を削除しました。しかしもちろん、疑問は残ります。スカーレット・ヨハンソンとは何の関係もない実在の人物のものであるのに、何ヶ月もかけて磨き上げて録音した声をなぜ削除するのでしょうか?
OpenAI がChatGPT Plusユーザーに対して音声サービスを開始する場合、5 つではなく 4 つのオプションを使用して開始します。つまり、ブリーズ、コーブ、エンバー、ジュニパーです。現時点ではこの新しい機能を使用することはできないため、コミュニティが残りの利用可能なオプションのトーンに類似点を見つけるかどうかを確認するまで待つ必要があります。
参考資料一覧
- https://x.com/dotcsv/status/1792472043960647769?s=46&t=zyx3pQB1gZauCXrLXoySnw
- https://x.com/OpenAI/status/1792443575839678909
