DALL-E 2 は、テキスト コマンドから画像を作成できる人工知能ツールで、あらゆる画像をその境界を越えて拡張する可能性を提供します。ユーザーは任意の写真や絵画をアップロードし、アルゴリズムがそれを大きな画像の一部として再解釈できるようにします。
このリソースを使用すると、クリエイターは特定のものから独自の作品を作成したり、DALL-E 2 がトレーニングされた何百万もの作品からインスピレーションを得たりすることができます。画像を最初から生成するのではなく、アルゴリズムは、アップロードされた画像のシャドウ ガイド、カラー パレット、テクスチャ、照明でフレーム化された、目的のフレーズを含む画像を生成します。この新機能は、DALL-E 2 内で画像をアップロードするときに利用できます。
結果は素晴らしいものでした。世界的な影響を与える芸術作品は、現在、何倍にも成長し続けることができる画像に拡張されています。最良の例は、ヨハネス・フェルメールによる有名なオランダの絵画「真珠の耳飾りの女」です。このバロック様式の油絵は、クローズアップの肖像画から、家の中央に女性が描かれている完全なシーンに変換されました。さまざまな指示があれば、女性はどこにでもなれるのです。絵画の曖昧さは、鑑賞者の想像力やアルゴリズムの想像力を連鎖させません。
この新機能は実際にはインターフェースの変更です。以前は、DALL-E 2 ではアップロードされたイメージ内でのみ世代を実行できるため、ユーザーはプロセス全体を手動で実行する必要がありました。その秘訣は、キャンバスを拡張し、画像をアップロードして生成することでした。よりシンプルかつ直接的に、Web インターフェイスから実行できるようになりました。
DALL-E2の新機能例
DALL-E 2 の公式 Instagram アカウントで、チームは次のようないくつかの作品を共有しました。
クリエイティブは、ファッションなどのさまざまな業界で画像内の要素を変更するためにこのツールを使用しています。DALL-E 2 は、デザインの作成に多大な時間と費用を投資することなく、素材や色のさまざまな提案を提供できます。または、人工知能は世界中の誰よりも多くのドレスを見てきたので、それをインスピレーションとして使用してください。
人工知能は現在です
ロボットが私たちの指示通りに絵を描いて私たちを驚かせるなど、数年前まではまったく考えられませんでした。実は彼には芸術の理解もセンスもない。また、プロポーション、演出、照明などの基礎も学んでいません。しかし、彼はそうする必要はなく、何十億もの写真、絵画、デジタルイラストを見てきました。 DALL-E 2 は、最近まで私たちがほとんど神聖であると信じていた活動を、単純な数学的予測問題に変換します。
そして最も驚くべきことは、出現しつつある競争です。 MidJourney や Stable Diffusion などの新しいツールは、小規模なチームによって設計されたニューラル ネットワークに基づいていますが、その結果は非常に詳細で信頼性が高くなります。さらに、イラストや絵画の概念を持たない多くのクリエイターも、これらの人工知能ツールのおかげで自分のアイデアを表現できるようになりました。
実際、これらのロボットが作っているのはインターネットから切り取った画像のコラージュであり、明らかにその仕事に対して報酬も支払われていないため、イラストレーターの中には満足していない人もいます。なぜなら?それはコピーではなく、単に見たものから学んだだけだからです。どのアーティストも、以前に観察した絵画、読んだ本、聞いた音楽から影響を受けます。作家の最も重要な仕事が読書であるとすれば、人工知能の最も重要な仕事は作品の分析です。
参考資料一覧
- https://www.midjourney.com/home/
- https://www.instagram.com/p/Ch7lzGApBV4/?utm_source=ig_embed&utm_campaign=loading
- https://stability.ai/blog/stable-diffusion-payment
