今回は、最近話題のStable Diffusionをご紹介します。
特に、ノートパソコンや低スペックPCでも使えるのかと言った内容からWEBサービスとの比較などわかりやすく解説します。
Stable Diffusionについて
Stable Diffusionとは、テキストから画像を作る画像生成モデルです。英国のStability AIが中心となって開発し、2022年8月にオープンソースとして公開されました。商用利用も可能です。
Stable Diffusionのライセンスは、CreativeML Open RAIL-M licenseというもので、Stable Diffusionを使って作成したモデルは、ライセンスを明記することで営利・非営利問わずに使用可能です。
生成した画像などについては、作成者自身が権利を持ちますが、ただし、法律に違反するものや人に危害を与えるもの、誤った情報を広めるものなどでの利用は禁止されています。
Stable Diffusionは、インターネット上から収集された数十億枚の画像とテキストのペアから学習し、潜在拡散モデルというアルゴリズムを使用して高解像度でクリエイティブな画像を生成できます。
Stable Diffusionは、自分のPCにインストールして利用する方法と、無料又は有料のWEBサービスを利用する方法の2つがあります。
Stable Diffusionはノートパソコンでも使えるのか?
Stable Diffusionはノートパソコンでも使えますが、条件があります。
まず、NVIDIA製GPUを搭載したビデオカードが必要です。
次に、VRAMが10GB以上あることが望ましいです。また、ストレージはSSDで1TB以上がおすすめです3。電源ユニットも十分な電力を供給できるものが必要です。
あなたのノートパソコンはこれらの条件を満たしていますか?
低スペックPCでもStable Diffusionを動かしたい
Google Colabを利用して、WEB上に必要なライブラリや設定をインストールし、操作のみ自分のPCから行うと言う方法があります。
Google Colabとは、Googleが無料で提供する機械学習プログラミングのための統合開発環境です。ブラウザから操作可能で、インストールも不要です。
GPUにアクセスできるので、大量のデータでも高速に処理できます。Pythonを記述、実行できるので、機械学習、データ分析、教育に特に適しています。
但し、GoogleColabでStableDiffusionを使うユーザーが急激に増えたため、2023年4月頃から無料でStableDiffusionを利用していると、警告が出るようになりました。
警告を無視して使い続けると、アカウントを停止される可能性がありますので、StableDiffusionをGoogleColabで利用するなら有料プランに加入することをオススメします。
私は、自分のPCにインストールできたのでGoogleColabは使っていません。
GoogleColabを使ったStableDiffusionのインストール方法については、以下におすすめのサイトをご紹介しますので参考にしてください。
- 簡単に Stable Diffusion のモデルを試せる Google Colab の …
- 【改訂】Stable Diffusion Web UIをColabで動かす
- Stable Diffusion XL を Google Colabで動かす(デモ)
- 【簡単】Stable DiffusionをGoogle Colabで動かす方法 …
- Stable Diffusion を Google Colab でシンプルに体験する方法
低スペックPCでもStable Diffusionを動かしたいのまとめ
GoogleColabが、有料になったので1日8時間まで使える完全無料の代替サービスがあるのでご紹介しておきます。海外のサービスなので、ご利用は自己責任でお願いします。
StableDiffusionは、好みの画像を生成するためには学習モデルが必用です。その学習モデルの1つ1つのファイルが大きくて、アニメだったり実写だったりと、ダウンロードしているとかなりの容量が必要になるので、PCのストレージはSSDで1TB以上あることが望ましいです。
また、インストールもPythonを使ったりGitのコマンド入力が必用だったりで、PC初心者の方にはかなりハードルが高い作業になります。
インストールする時間も、かなり長くて私でも4時間ぐらいかかりました。
特に、最後のtable-diffusion-webui のインストールには10GB程度のデータがダウンロードされるため、環境によっては30分以上かかることがあります。
途中で止まっているように見えるので、再起動を繰り返す人がいますが、アドレスが表示されるまでじっと待ちましょう。
StableDiffusionをインストールするために役立つサイトはこちら
【最短&簡単】Stable diffusion web UI インストール方法(AUTOMATIC1111版)
このように、StableDiffusionをインストールして利用する方法はいくつかありますが、はっきり言ってStable DiffusionをベースとしたWEBサービスを利用した方が簡単です。
WEB版 Stable diffusion
WEB版の使い方は、とても簡単です。
Stable Diffusionは、潜在的なテキストから画像への拡散モデルであり、任意のテキスト入力が与えられた場合に写真のようにリアルな画像を生成し、信じられないほどの画像を生成するための自律的な自由を育成し、何十億もの人々が数秒で見事なアートを作成できるようにします。
安定した拡散をオンラインで無料で使用して美しいアートを作成します 。
Stable Diffusion Online(英文を翻訳して引用)
Stable Diffusion WEB版の使い方
まずは、Stable Diffusion公式サイトと検索するとこのサイトが出てきますので、使い方を説明します。
1・以下の、Stable Diffusion Onlineの「Get Started for Free(※①)」をクリックすると、自動的に下までスクロールします。
2・以下の「stable diffusion playground」画面で、Enter your prompt(テキストエリア)に、作りたい画像のプロンプトを入力(※英語を推奨)し、「Generate image」をクリックします。
3・私のノートPCでも、約30秒ぐらいで以下の様な、画像ができました。
公式サイト以外のstable diffusion Webサイト
stable diffusionは、オープンソースなので公式サイト以外にも利用できるWEBサイトがあります。
・DreamStudio おすすめ度:★★★☆☆ https://dreamstudio.ai/
DreamStudioは、Stability AI社が開発・運営する画像生成AIの「Stable Diffusion」のオープンβ版として公開されたサービスです。テキスト(プロンプト)を入力するだけで画像が生成されます。SDXLというより精緻な画像生成モデルも提供されています。無料で利用できますが、商用利用には料金プランが必要です。
・Leonardo.Ai おすすめ度:★★★★☆ https://app.leonardo.ai/auth/login
Leonardo AIは、Stable Diffusionを基に動作し、MidjourneyやDall-Eなどのサービスに似たテキストから画像を生成するプロセスを特徴としています。インストールもアプリも必要なく、PCはもちろん携帯(スマホ)からでも同じように使う事ができます。
・SeaArt AI おすすめ度:★★★★☆ https://www.seaart.ai/home
seaart.aiは、初心者でも簡単に美術作品を生成できる画像生成AIツールです。アイデアを言葉で入力するだけで、リアルな映像からアニメイラストまで、様々な高品質画像を即座に作り出すことが可能です。
Stable Diffusionをベースに動作しており、Stable Diffusionとほぼ同等の機能が使え、LoRAも利用できます。civitaiのLoRAモデル共有プラットフォームからもLoRAを利用できます。
・mage space おすすめ度:★★★☆☆ https://www.mage.space/
mage spaceとは、Stable Diffusionを用いた高品質な画像生成サービスです。mage spaceを利用することで、誰でも簡単に高品質な画像を生成できます。また、AIが自動的に生成した画像を修正する事も可能。
プロンプト(呪文)の使い方
呪文は基本的に英語で、単語を半角のスペースで区切って入力します。簡単な、例を以下に表示しますので参考にしてください。
コチラのサービスで説明します。→Stable Diffusion Online
Prompt と Negative Prompt
1:例えば、「green apple」と入力してみると。
2:次に「green apple on the tree」と入力してみると
複数のワードがある場合には、前にあるワードが優先順位が高くなります。
3:描画したくないものを除去する場合は、Negative Promptにワードを入れます。以下の例は、背景を除去するように指定しました。
このように、Promptに、様々な呪文を入力する事で自分の描きたい画像を作り、Negative Promptで必要ない部分を削っていくと言う作業で、理想の画像を作り出していきます。
呪文には、単純に英語のフレーズを区切っていくだけではなく、一定のルールがありますので、しっかり学びたい方は書籍などを購入されることをおすすめします。
プロンプト(呪文)を学ぶ方法
stable diffusionは、文字で入力した結果を画像で表すものなので、どうしてもプロンプト(呪文)を学ぶ必要があります。
プロンプト(呪文)は、Web上にも沢山配布されていますが、やはりちゃんと学びたいという事ならやっぱ電子書籍ですね!
以下にご紹介する書籍は、電子書籍なので購入するとすぐに読む事ができます。また、Amazonの読み放題に加入市営る方は0円で利用する事ができます。
低VRAMではじめるStable Diffusion – 画像生成AIでゲーム素材を作ろう Kindle版
『Stable Diffusion』は、テキストの入力から画像を短時間で生成してくれる画像生成AIです。このAIは、Automatic1111 版の Web UI を利用すれば、専門知識がなくてもGUI環境で使えます。
『Stable Diffusion』の利用には豊富なVRAMが要求されますが、低スペックの環境やオンライン環境でも利用可能です。
本書では、4GBの低VRAM環境や、マシンを問わないオンライン環境で『Stable Diffusion』を使い、ゲーム開発用の画像素材を作る方法を示します。
序盤ではまず、低VRAM環境やオンライン環境での導入をおこないます。そして、各種設定や呪文理論の解説をおこないます。
中盤以降は、背景、キャラクター、ポーズ、学習、ミニキャラ、アイテム、アイコン、絵地図、UI部品の作成を説明していきます。
本書は10万字以上の本文、350枚以上の画像で詳細に解説をしていきます(2023年3月上旬執筆)。 (Amazon 書籍の説明文より)