Google は I/O を活用して、生成 AI における力を示しています。 Gemini の新機能のいくつかと将来の Astra プロジェクトを紹介した後、同社は新しいテキストから画像への生成モデルである Image 3 を世界に公開しました。同社によると、これは現在利用可能なすべてのモデルの中で最高品質です。その瞬間。

この新しいテキストから画像への生成モデルは Google Deepmind から提供されており、Mountain View 社のマルチモーダル テクノロジのすべての能力を利用して、ユーザーが望むのであれば、可能な限り最もリアルな画像を生成します。また、画像 3 を使用すると、漫画やユーザーが思い浮かぶあらゆる美学など、あらゆる種類の画像を生成できます。 Google はまた、このモデルが、広告で使用されるようなテキストを含む画像を生成する場合にも最も強力であることを確認しました。

画像 3 では、自然言語を使用して写真を生成できます

  • プロンプト: 「カメラに向かって微笑む、短い髪とひげを生やした男性の写真。背景がぼやけており、木々や建物が明るい色で表示されています。」 [「短い髪とひげを生やした男性がカメラに向かって微笑んでいる写真。背景がぼかされていて、明るい色の木々や建物が写っている。」]
Google画像3
  • プロンプト: 「上からの眺め。水と緑の山々を見渡す、3 つの美しい渓谷のパノラマ ビュー。 「パステルカラー。」 [「上からの眺め。水と緑の山々を見渡す、3 つの印象的な渓谷のパノラマ ビュー。パステルカラー。』
Google画像3
  • プロンプト: 「夢のようなジャングルの中で誇らしげに咆哮する雄大なライオンの詳細なイラスト、紫色の白い線画の背景、明るい紫色の紙のテクスチャ上のクリップアート。」 [「夢のようなジャングルの中で誇らしげに咆哮する雄大なライオンの詳細なイラスト、紫色の白い線画の背景、薄紫色の紙のテクスチャ上のクリップアート。」]
Google画像3

AIを活用した音楽制作ツール「Music AI Sandbox」

YouTubeビデオ

Image 3 の画像生成に加えて、Google はサウンドと音楽の生成に特化したモデルであるMusic AI Sandbox も導入しました。 YouTube と協力して開発されたこのテクノロジーは、サウンドをゼロから作成したり、トラック スタイルを切り替えたりするためのツールを通じて、音楽生成に新しいひねりを加えます。

同社は、Music AI Sandboxの仕組みについて多くの詳細を明らかにしていない。すぐに検査できるかどうかについても情報を提供していない。

参考資料一覧

  1. https://twitter.com/GoogleDeepMind/status/1790434754237530588

Google Image 3 と Music AI Sandbox: 素晴らしい音楽と写真を作成する新しい AI・関連動画