ChatGPT は永遠に変わろうとしています。 OpenAI は、人工知能チャットボットのアップデートを発表しました。これにより、ユーザーと大声で話し、会話を維持できるようになります。テキストを介したインタラクションに限定されなくなり、プラットフォームを別のレベルに引き上げる劇的な進化。

ChatGPT では、 iOSおよびAndroidアプリを通じてオーディオ サポートが提供されるようになります。新しいバージョンにアクセスすると、AI チャットボットと直接チャットすることができ、 5 つの異なるオプションからどの音声を与えるかを選択できます

OpenAI が説明しているように、この ChatGPT 機能は、数秒の音声サンプルから音声応答を生成できる新しいテキスト読み上げモデルに基づいています。これにプロの声優との協力が加わることで、人工知能とのやりとりがより人間らしく感じられます。

開発者らはさらに、ChatGPTの新バージョンはWhisper音声認識システムを使用してユーザーの質問を音声からテキストに変換すると説明した。 X (Twitter) の次の投稿では、チャットボットとの音声会話がどのように機能するかを確認できます。

ChatGPT の音声オプションはデフォルトでは有効にならないことに注意してください。この手段を通じてチャットボットとチャットしたい場合は、[設定] > [新機能]で手動で有効にする必要があります。これが完了すると、チャットボットに与える音声の種類を選択できるようになります。

 ChatGPT は見たり、聞いたり、話したりできるようになりました

ChatGPT は見たり、聞いたり、話したりできるようになりました

ChatGPT クロム拡張コンピュータ OpenAI

音声機能の追加は段階的に行われますので、予めご了承ください。これは、ChatGPT モバイル アプリのすべてのユーザーが初日からそれらを使用できるわけではないことを意味します。 OpenAI は、この新しい機能が段階的にアクティブ化され、最初に ChatGPT Plus および Enterprise サブスクライバーに届くことを保証します。これは今後 2 週間にわたって行われます。

同社は、悪意のある利用を避けるため、この技術をアプリ内のチャットボットとの会話に限定することを示唆した。 「わずか数秒間の実際の音声からリアルな合成音声を作成できる新技術は、クリエイティブでアクセシビリティを重視した多くのアプリケーションへの扉を開きます。しかし、これらの機能は、悪意のある者が公人になりすます可能性など、新たなリスクももたらします。さもなければ詐欺を犯す」とサム・アルトマン氏は語った。

このアップデートにより、ChatGPT は聞いたり話したりできるだけでなく、見ることもできることは注目に値します。これは、iOS および Android アプリのユーザーが写真を使用してチャットボットと対話できることを意味します。したがって、たとえば、画像を撮影し、特定のタスクを実行するために AI に助けを求めることができるようになります。

興味深い事実は、写真自体をキャプチャするだけでなく、人工知能がそこに焦点を合わせるように、一部のセクションに「描画」することも可能になるということです。 OpenAI によると、この新機能は GPT-3.5 と GPT-4 の両方に基づくマルチモーダル プラットフォームによって強化されています。

「他の ChatGPT 機能と同様に、ビジョンはユーザーの日常生活を支援することです。ユーザーが見ているものを認識できるときに、それが最も効果的に機能します」と開発者は述べています。ただし、このスタートアップは、この画像ベースの機能にも制限を適用しました。これは、たとえば、写真が人物の場合には機能しないことを意味します。 「ChatGPTは必ずしも正確であるとは限らず、これらのシステムは個人のプライバシーを尊重する必要がある」と彼らはOpenAIから説明した。

参考資料一覧

  1. https://openai.com/blog/chatgpt-can-now-see-hear-and-speak

ChatGPT はより人間的になります: 最大 5 つの異なる声で話すことができるようになりました・関連動画