TikTok は、数秒であなたの声を複製できる人工知能を活用した新機能の開発に取り組んでいます。これは、Android デバイス用のソーシャル ネットワーク アプリのベータ版でこの機能の痕跡を発見したリーカー AssembleDebug によって明らかにされました。
このツールが最終的にリリースされる場合、TikTokの最終バージョンにいつ組み込まれるかはまだ不明です。この発見はすでに、ディープフェイクの作成などに不正に使用される可能性があるかどうか、またプラットフォームにそれを防ぐ方法があるかどうかについて、多くの議論を巻き起こしている。
リーカーは、この関数にはまだ決定的な名前がないようだと説明しています。コードの分析中に、彼は新しい「TikTok Voice Library」と「人工知能であなたの声を作成する」オプションへの参照を発見しました。 AssembleDebug は、利用可能になったときにユーザーに表示されるグラフィカル インターフェイスを読み込むことができたため、ビデオ アプリケーションの開発はかなり進んでいると思われます。
ようこそ画面には、TikTok があなたの声を 10 秒間聞くだけでクローンが作成されることが示されています。このステップが完了すると、ユーザーは AI が作成した合成バージョンを自分のビデオに適用できるようになります。これは、テキスト読み上げツールを通じて可能になります。
基本的に、TikTok では、ナレーションを録音せずに、公開する動画に自分の声でナレーションを追加できます。必要なことを書くだけで、残りはプラットフォームが処理してくれます。
TikTokは人工知能を使ってあなたの声を複製します
この新しい TikTok 機能で最も印象的なのは、その人工知能があなたの声を複製するのにわずか 10 秒しかかからないということです。利用規約に同意した後、ユーザーは画面に表示されるテキストの断片を読んでいることを録音する必要があります。アプリケーションは、デジタル バージョンを生成するための処理を担当します。もちろん、人々は第三者の権利を侵害するものではなく、本当の声を使用する必要があります。これは、簡単に言うと模倣品が禁止されることを意味します。
ソーシャルネットワークの責任者は、このツールがどのように機能するのか詳しく説明していない。彼らは、音声から情報を抽出してクローンを作成することを示しているだけであり、必要に応じていつでもTikTok音声ライブラリから削除できることを明確にしています。しかし、AIで作成した音声がどの程度の範囲で利用されるのかについては、依然として疑問が多い。
AssembleDebug は利用規約のスクリーンショットを撮っており、これらはクローンされた音声を作成したユーザーが利用できるだけでなく、 TikTok 上の誰もが音声ライブラリを通じてアクセスできることを暗示しています。以下は問題のテキストの一部です。
「お客様は、お客様の音声が悪用および/または悪用される(プラットフォーム上の音声ライブラリのエンドユーザーによるものを含む)リスクを軽減するために当社側で努力が払われますが、当社が正確に予測することはできないことを認め、これに同意するものとします。さらに、お客様は、音声ライブラリのユーザーが、本音声ライブラリ規約の受諾時に意図されていない状況でお客様の音声を使用する可能性があることを認め、これに同意します。なるあなたのそばを通り過ぎて、あなたが同意しないことや攻撃的だと思うことを言ってください…[…]」
一見すると、これにはプライバシーの悪夢となる要素がすべて揃っているように見えます。ただし、TikTok が人工知能を使用してクローン音声へのアクセスと使用がどのようになるかを明らかにするのを待つ必要があります。 ByteDance がこの機能の展開を進めれば、同社の 人気ビデオ アプリの最終バージョンで間もなくこの機能が登場することも珍しいことではありません。
参考資料一覧
- https://thespandroid.blogspot.com/2024/04/TikTok-AI-Voice-Cloning-Feature.html
