Big Sleepとは、テキストから画像を生成するモデルです。
画像生成の深層学習モデルとして CLIP + BigGAN を使用しています。
Big Sleepで生成した画像サンプルは下記のサイトで確認できます。
Big Sleep - https://github.com/lucidrains/big-sleep
Big Sleepのインストール
Big Sleepをインストールするためには下記のコマンドを実行します。
[Google Colaboratory]
1 | # BigSleepのインストール |
テキストから画像生成
テキストから画像を生成してみます。
簡潔なテキストの方が画像生成しやすいと思いまして、“little cat”というテキストを指定しました。
[Google Colaboratory]
1 | # テキストからの画像生成 |
次のような画像が生成されました。
猫の一部のようなものと、中心付近には猫の足跡(?)が描かれた画像が生成されました。
言葉の選択がよくなかったのでしょうか・・・・。
ただテキストから画像を作成するというのはいろいろな可能性を感じるので、ほかのテキストでも画像生成を試してみたいと思います