Big Sleep - テキストから画像生成①

October 24, 2021

Big Sleepとは、テキストから画像を生成するモデルです。

画像生成の深層学習モデルとして CLIP + BigGAN を使用しています。

Big Sleepで生成した画像サンプルは下記のサイトで確認できます。

Big Sleep - https://github.com/lucidrains/big-sleep

Big Sleepのインストール

Big Sleepをインストールするためには下記のコマンドを実行します。

[Google Colaboratory]

1 2	# BigSleepのインストール !pip install big-sleep

テキストから画像を生成してみます。

簡潔なテキストの方が画像生成しやすいと思いまして、“little cat”というテキストを指定しました。

[Google Colaboratory]

1 2	# テキストからの画像生成 !dream "little cat"

次のような画像が生成されました。

猫の一部のようなものと、中心付近には猫の足跡（？）が描かれた画像が生成されました。

言葉の選択がよくなかったのでしょうか・・・・。

ただテキストから画像を作成するというのはいろいろな可能性を感じるので、ほかのテキストでも画像生成を試してみたいと思います