AI技術が再び境界を押し広げ、今回はゴッホの傑作を「解体」することができるようになりました!
元の絵画を1枚提供するだけで、人工知能はゴッホの筆致を模倣し、絵画全体の制作過程を段階的に再現することができます。
両者を注意深く比較すると、AIはほぼ1:1の複製を実現し、絵画全体の構築プロセスを私たちに示してくれます。
この驚くべき技術は、ワシントン大学の研究室から生まれ、「Inverse Painting」と名付けられました。このプロジェクトの学術的成果はすでに認められ、トップレベルの会議であるSIGGRAPH Asia 2024で発表される予定です。特筆すべきは、研究チームに2人の中国人学者が含まれていることです:東北大学のBowei ChenとShanghai Tech Universityの卒業生であるYifan Wangが、この画期的な研究に貢献しました。
技術的詳細の深掘り
この技術はどのように機能するのでしょうか?その背後には、拡散モデルベースの逆絵画法を使用して入力画像をアートワークに変換する複雑なシステムがあります。このプロセスはいくつかの主要な段階に分かれています:
絵画プロセスの学習:プロジェクトチームは294のアクリル画の制作動画を収集し、綿密な処理を経て、AIは実際のアーティストの創作技法を学ぶことができました。
絵画指示の生成:AIは異なる要素(空、木、人物など)とそれらの関係を分析し、次に何を描くべきかを自身に指示する一連の指示を生成します。
拡散モデルによる画像生成:これらの指示を使用して、AIは徐々に詳細を追加し、人間のアーティストの絵画プロセスをシミュレートして、少しずつ完全な作品を構築することができます。 テキストと領域の理解:指示の生成に加えて、AIは領域マスクを作成し、絵画の各要素が正しい位置にあることを確認し、絵画の精度と効果を向上させます。
段階的レンダリングと時間制御:AIは空白のキャンバスから始まり、完全な絵画シーケンスを徐々に生成しながら、実際の制作の時間間隔を模倣し、絵画全体により自然で流動的な感覚を与えます。
トレーニングとテストプロセス
全体のプロセスは主に2つの段階に分けることができます:
第一段階:指示生成
この段階では、2つのインテリジェントジェネレーターが配置されます:1つはテキスト指示用、もう1つは領域選択用です。テキスト指示ジェネレーターは、目標作品と現在のキャンバスを比較し、「空を描く」や「花を追加する」などの具体的な提案を行います。同時に、領域選択ジェネレーターは二値画像を作成し、修正が必要な領域を正確にマークします。これら2つの指示の組み合わせにより、AIが適切な位置で正確に描画できることが保証されます。
第二段階:キャンバスレンダリング
キャンバス更新段階では、前段階の指示を実践に移します。ここでは、ノイズから徐々に明確な画像を精製できる拡散モデルベースのレンダリング技術が採用されています。更新プロセス中、レンダラーはテキスト指示、領域選択、時間の進行、および目標作品と現在のキャンバスの特徴比較など、多面的な要素を考慮します。この多次元的な考慮により、AIは人間のアーティストの創作プロセスとスタイルにより近づくことができます。
テスト段階
テスト段階では、AIシステムはゼロから完全な絵画を作成する能力を示しました。このプロセスには注目に値する2つの核心的特徴があります:
一貫性:AIは自己参照的な方法を使用し、各ストロークが前のストロークの基礎の上に構築されます。これにより、人間のアーティストが各筆触を慎重に考慮するのと同様に、創作プロセス全体の一貫性と論理性が確保されます。
時間シミュレーション:**システムは各キャンバス更新の間に固定の時間間隔を設定し、実際の絵画における時間の経過を巧みにシミュレートし、AIの創作リズムをより人間に近づけています。
最終的に、3つのベースライン手法(Timecraft、Paint Transformer、Stable Video Diffusion)と比較して、その生成結果は明らかに優れていました。
コミュニティディスカッションと論争
この技術がRedditで公開されるとすぐに、広範な議論を引き起こしました。最も人気のあるコメントは、アーティストコミュニティへの懸念を表明しています。
しかし、多くの人々も肯定的な態度を持っています。彼らは、この技術が絵画を学ぶための強力なツールになる可能性があり、アート愛好家に貴重な学習リソースを提供すると考えています。XXAIのようなソフトウェアは、アート愛好家に優れた絵画のアイデアを提供することができます。
[]
結論
要するに、ワシントン大学の「Inverse Painting」プロジェクトは、技術とアートの素晴らしい組み合わせを生き生きと示すと同時に、人々に考えさせるきっかけを与えています。AIを使用して創造性を高めながら、どのように人間独自の創造的視点を維持できるでしょうか?技術とアートの間でどのようにバランスを見つけることができるでしょうか?これらは、この興奮する技術の未来を受け入れる際に深く探求する必要のあるトピックです。