Stable Diffusion（日本語オンライン）画像生成手順

AIはさらに進化している。日本でも使用できる安定拡散など、最近の進歩により、簡単なテキストプロンプトで画像を生成し、複数のパラメータで最適化し、著作権の問題なしに使用することができる。面白いだろう？それでは、Stable Diffusion Artificial Intelligenceを使えば、このようなこと（およびそれ以上のこと）が可能になることを説明しよう。

Stable Diffusionとは？

Stability AIによって開発されたStable Diffusionは、テキストから画像への人工知能であり、自然言語で記述された簡単なテキストから画像を生成することができる。

このAIモデルは、通常のGPUで実行することができる。さらに、結果を微調整することもできる。

Stable Diffusionは、テキストプロンプトにマッチする画像を作成するように訓練されたLAION Aestheticデータセットで部分的に実行される。より良いアウトプットのために利用できるアドオンもある。さらに、人工知能を使ってアニメーションを生成することもできる。

Stable Diffusionは、学習済みモデルとしてインストールされている「潜在拡散モデル」というアルゴリズムを使用しており、ユーザーはテキストプロンプトを入力するだけで、さまざまなタスクを実行できる。

Stable Diffusionの使い方は、テキストを入力して画像を出力するという、表面的には非常にシンプルなものだ。

しかし、インターフェースにはカスタマイズオプションが用意されており、英語が得意なユーザーの方がより正確な画像を作成できる可能性が高い。最終的な結果は、AIツールにタスクをどれだけうまく説明できるかにかかっているからです。

安定拡散と他の画像生成AIとの比較

Stable Diffusionの最大の違いは、無料で利用できることです。他のほとんどの画像生成AIは、有料であったり、利用回数に制限があったりします。

Stable Diffusionのソースコードは誰にでも公開されています。詳細なテキストプロンプトを入力するだけで、画像を作成し、出力を操作することができます。さらに、ここで作成できる画像の数に制限はありません。

また、Stable Diffusionには著作権の問題もありません。ここで作成した画像は、誰かに法的措置を取られる心配もなく、自由に使用することができます。ただ、画像の商用利用には、ライセンス上の制限があります。

安定した拡散のバージョン/モデル

ウェブアプリケーションで公開されている3つのサービスを使って、Stable Diffusionを試すことができます。以下に、それぞれのウェブアプリケーションの簡単なレビューと、高画質画像を生成するためにこれらをどのように採用できるかをご紹介します。

注：ウェブバージョンは、インターネットに接続できる環境であれば誰でも利用できます。非常に簡単なインターフェイスですが、一部の機能へのアクセスには追加料金が必要な場合があります。

Hugging Face:

自然言語処理データセットを共有・利用するためのオープンソースコミュニティです。Stable Diffusion 2 Demoもこれらのデータセットに含まれている。Stability Diffusionを提供している会社名 “Stability AI “を検索してください。Hugging FaceのSpacesから検索結果を探し、Stable Difusionを選択します。

Hugging Faceの操作手順はとても簡単です。思い描いているイメージを精巧に説明するプロンプトを入力し、クリックしてイメージを生成するだけです。しかし、正確な結果を得たいのであれば、プロンプトを正確に入力することが重要です。

Hugging Faceには、画像を変更したり、品質を向上させるために使用できるユニークなカスタムオプションも用意されています。より良い結果を得たい場合は、Stable Diffusionに “8K画質で画像を提供 “するよう指示することができます。人工I

知能に、より良い品質の結果を提供するよう指示する別のフレーズには、リアル、フォトリアリスティック、品質4kなどがあります。

Hugging Faceには、画像を変更したり、品質を向上させるために使用できるユニークなカスタムオプションも用意されています。より良い結果を得たい場合は、Stable Diffusionに “8K画質で画像を提供 “するよう指示することができます。

人工I

知能に、より良い品質の結果を提供するよう指示する別のフレーズには、リアル、フォトリアリスティック、品質4kなどがあります。

Mage:

MageはHugging Faceと似たような操作だが、「避けたい画像のポイント」を指定する機能がある。

Mageのインターフェースを開くと、メイン画面がテキスト入力エリア、画像生成ボタン、オプション設定に分かれているのがわかる。適切なフィールドにプロンプトを入力し、右上の「Enhance」を選択することで、最高の結果を得ることができます。

さらに、ガイダンススケールを利用して、プロンプトの忠実度を調整し、アーティストのスタイルに近づけることができます。ガイダンス・スケールを「非常に厳しい」に設定し、結果を比較してみてください。

ネガティブプロンプト」については、「アドバンスモード」にアクセスして、画像に不要な項目を指定することができます。人工知能がそれに応じて画像を調整します。

Dream Studio

ドリームスタジオは、ハギングフェイスよりも早く画像を生成することができます。

ドリームスタジオにアクセスして、すぐに画像を生成することができます。最初にログイン画面が表示されます。Gmailアカウントを使用してログインすると、画像生成画面が表示されます。

ドリームスタジオの基本的な使い方を説明しましょう：

メニューをタップし、画像生成のためのDreamタブを選択します。

履歴]タブが表示され、過去に生成された画像を保存し、アクセスすることができます。

ドリームスタジオでは、プロンプトガイドも提供しており、初心者向けにプロンプトの作り方や使い方が詳しく説明されています。

最後に、FAQセクションがあります。ここでも、ドリームスタジオの使い方を学ぶ初心者にとても役立ちます。

画面の右側には、生成された画像を調整するための機能のリストがあります。以下が含まれています：

幅
高さ
Cfgスケール（テキストの忠実度）
ステップ（画像生成に必要なノイズ除去回数）
画像数
サンプラー（ノイズ除去のアルゴリズム指定）
モデル
Seed（画像生成に使用する乱数の初期値）

ページ下部には、入力エリアと画像生成実行ボタンがあります。適切なフィールドにプロンプトを入力し、パラメータを使用して好みに応じて結果を調整します。

Stable Diffusion web ui

AUTOMATIC1111は、ユーザーが簡単に Stable Diffusion web ui 人工知能にアクセスし、使用できるように、Stable DiffusionウェブUIツールを発表しました。Stable Diffusionは2つの方法で使用することができます：

ローカル環境
クラウド環境

ローカル環境で使用する場合は、以下の推奨仕様に留意してください：

システム	日付
オペレーティングシステム	Windows
GPU	VRAM 12GB以上
メモリ	16 GB以上

プログラムの実行にはPCのスペックが必要なので、まずはクラウド上で実行することをお勧めする。

Stable Diffusionをどのように使用するかに関わらず、GitHubで公開されているソースコードをインストールする必要があります。

Stable DiffusionのウェブUIは2種類あります。

Txt2img: テキストを使って画像を生成します。
Img2img: 画像を読み込んで新しい画像を生成します。

Img2imgは、特定の結果を念頭に置いた画像が欲しいユーザーにより効果的です。Stable Diffusionの機能については、以下のセクションをご覧ください。

Stable diffusion 学習させる

Stable Diffusionを使用していて、英語が苦手な方は、画質に影響するサンプリング周波数やCFGスケールなどが日本語にも対応していることを知っておくと便利です。

日本語版のStable Diffusionを使うには、2つの方法があります：

チャラル」公式Discordで画像を制作する。
ツイッターでAIりんなの「お絵かき会場」を開く。ここで、返信欄にテキストを入力すると、Stable Diffusionの仕組みと同じように画像版を入手することができる。

この方法はそれほど分かりにくいものではない。AIりんなのTwitterアカウントを使って画像を生成する方法を簡単に説明しよう。

AIりんなのTwitterアカウントを開く。
お絵かき会場」と書かれたツイートにリダイレクトする。
返信欄に「描いてほしい絵の画像」と書く。
続けて返信欄に文字を入力する。最初は “これは不適切なので自主規制します “という通知が出るかもしれない。しかし、何度か試すと、「Chararu」と呼ばれる画像生成AIサービスに誘導される。
これで、日本版安定拡散の魔法を体験し始めることができる。

6. Chararuの招待リンク」を選択すると、Discordの登録画面にリダイレクトされる。

7. Discordの画面で登録とアピールを完了させてください。

それでは、DiscordでChararuを使って画像を生成する手順を説明します。

チャンネルから “#|ai drawing venue”を選択します。
create “を入力し、“Tsukuru” を呼び出します。
次に、生成したい画像のプロンプトを日本語で入力します。

安定した拡散のインストール要件

Pythonのインストール
UIのインストール
モデルのインストール
インターフェースの使用

Stable Diffusionをローカルにインストールする手順：

最低6GBのメモリ（NVRAM）があれば、Stable Diffusionをローカルにインストールすることができます。さらに、カスタマイズされたモデルを利用し、LoRAで結果を改善することができます。ローカルインストールの方法は以下の通りです：

SDXLのベースモデルとリファイナーをStability AIから入手する。
Python 3.10とGitをインストールする。
次に、Automatic 1111からWebUIをダウンロードする。(ウェブUIは、ユーザーが簡単にStable Diffusionを使用できるようにAUTOMATIC1111が提供するツールです)。画面の指示に従ってセットアップする。
ベースとリファイナーモデルをwebUIディレクトリの下にある “models/Stable-diffusion”フォルダに移動する。
メインのWebUIフォルダーにあるWebui.botをダブルクリックします。
インストールが完了するまで待ちます。
その後、ウェブブラウザを開き、ポート8760でローカルホストにアクセスできます。これで完了です。これでStable Diffusionを使い始める準備ができました。

Stability AIはこのほど、XLバージョン1.0（2023年7月26日）をcreativeML Open RAIL-Mライセンスでリリースした。ベースモデルとリファイナーがあり、どちらも解像度は1024 x 1024です。

Stable Diffusionの特徴

テキストから画像への生成

これは最も単純な使用シナリオです。テキストプロンプトを入力すると、それに応じてSDが画像を生成します。

画像間の生成

Stable Diffusionの助けを借りて、既存の画像を改良することができます。微調整したい画像を提供し、AIに望ましい変更を促します。

インペインティング

インペインティングはImg2Img生成と似ていますが、画像の特定の部分のみで機能します。インペインティングでは、画像、バイナリマスク（微調整したい部分）、プロンプトを指定します。結果画像では、指定した部分のみがプロンプトの要求通りに変更されます。

アウトペインティング

アウトペインティングでは、既存の画像に追加することができます。安定拡散に方向性を与え、入力画像をどのように拡張したいかをプロンプトで指定します。アウトペインティングは、すでにSDでシード画像を生成している場合に効果的です。

さらに

コントロールネット
グラフィック、アートワーク、ロゴの作成
微調整（ドリームブース、LoRAs（低ランク適応）、テキスト反転）
ビデオ作成

安定拡散の利点

Stable Diffusionは最も人気のある人工知能ツールの一つです。このプラットフォームの助けを借りて、テキストから素晴らしいAIアート画像を簡単に生成することができます。Stable Diffusionが提供するその他の利点について、以下に簡単に説明します：

使いやすい。インターフェイスは非常にシンプルで、迅速なナビゲーションを約束します。

数秒で高品質の画像を生成できます。テキストプロンプトを入力し、Generateをクリックするだけで結果が得られます。

素早く画像を生成するための理想的な人工知能です。

Stable Diffusionはあなたのプライバシーを保護します。個人情報を収集したり、生成された画像を保存したりすることはありません。

Stable Diffusionは無料ですか？

はい、Stable Diffusionは無料でご利用いただけます。ウェブアプリケーションを使ってクラウド上で実行することができます（Dream Studioは有料サービスです）。また、上記のセクションで説明した手順でローカルにダウンロードすることもできます。

Dream Studioでは、約200枚分の200クレジットを無料で作成できます。それ以上サービスを利用するには、追加料金を支払う必要があります。

ドリームスタジオの有料サービスについては、以下の点にご注意ください：

1,910円単位で追加可能。

1,910円あたり約1,000枚の画像を追加できる。

一方、StableStudioはDream Studioと同様の機能をすべて無料で提供しています。オープンソースで開発されており、近い将来、さらに多くの機能が追加されるかもしれない。