Googleは、 OpenAI、Midjourney、または同様の企業が設計したものと競合できる新しい人工知能モデルの開発に関して協力している。 Mountain View 社は、DALL-E と非常によく似た方法で動作する生成 AI であるMusiLMを発表しましたが、重要な違いがあります。それは、短いテキストの説明を使用して画像をデザインする代わりに、音楽を生成することです。
特に MusiLM は、 24 時間の品質で数分間のオーディオ トラックを作成できます。 kHz をさまざまな複雑さのテキストで説明します。また、「音質とテキスト説明への準拠の両方で以前のモデル」を上回っており、さまざまな音楽ジャンルとミュージシャンの経験レベルの両方を解釈できると同社は述べています。
TechCrunchで詳しく説明されているように、短いテキストの説明を使用して曲を生成するために、 MusicLM は最大 280,000 時間の音楽でトレーニングされています。その結果、「フルートとギターを使用した、瞑想的で穏やかでリラックスできる曲」といったシンプルな説明のトラックが完成しました。音楽はゆっくりとしたもので、平和と静けさの感覚を作り出すことに重点を置いています。」あるいは、より複雑なものとしては、「レゲトンとエレクトロニック ダンス ミュージックを融合させた、空間的で別世界のようなサウンド。宇宙に迷い込んだかのような体験を誘発し、踊れると同時に驚きと畏怖の念を呼び起こす音楽となるでしょう。」
Google の新しい生成 AI の興味深い機能は、テキストの説明を通じて曲を作成することで、WikiPedia などのポータルから抽出された説明の断片を通じて、ある意味で有名な絵画を音楽的に解釈できることです。場合によっては、はい、AI は歪んだ曲や非常に不快な合成音声を生成する傾向があります。
Googleは新しい生成AIモデルの開発に注力
現時点では、MusicLM は一般公開されていません。ただし、この AI は、Google が人工知能の分野で何ができるかを示すもう 1 つの例です。実際、同社は人間と自然に会話することを目的とした ChatGPT に似た独自のチャットボットや、短いテキストの説明を使用して画像を生成できる独自の AI も持っています。
しかし同社は、OpenAIが設計した人工知能モデルに対抗するために、一般公開されている人工知能モデルをリリースする予定だ。まあ、それ自体でさえ、ChatGPT と GPT-3 (または間もなく利用可能になるGPT-4)の機能が独自の検索エンジンに取って代わる可能性があることを懸念しています。
実際、グーグルのサンダー・ピチャイCEOは、イーロン・マスクが設立した会社が作った製品の代替となる新製品を開発・発表するために、人工知能に基づく新しいツールの設計を担当するチーム全体を再編する予定だった。
参考資料一覧
- https://google-research.github.io/seanet/musiclm/examples/
- https://techcrunch.com/2023/01/27/google-created-an-ai-that-can-generate-music-from-text-descriptions-but-wont-release-it/
