Stable Diffusion 実践ガイド(セットアップとプロンプト設計)

一行要約

ローカル環境に SD を導入し、プロンプト/ネガティブ/重み付けの原則で高品質画像を安定生成する。

概要

  • WebUI(AUTOMATIC1111)を前提に、モデル導入・VRAM対策・基本プロンプトの型を整理
  • ネガティブプロンプトと重み付けを使い、破綻(手/文字/低解像度)を最小化
  • Danbooruタグや Highres.fix、img2img を文法的に使い分ける

なぜ重要か

  • 生成品質は「ネガティブ」「重み」「構図キーワード」の整備が8割
  • セットアップ手順を固定化し、再現性ある結果と短時間反復を実現

詳細な説明

1) インストール(Windows想定)

  • Git/Python を導入 → WebUI リポジトリを clone → モデル ckpt/safetensors を配置
  • 省VRAM起動: --medvram を webui-user.bat に設定(品質低下 < 10% でメモリ効率化)
  • 参考: Stable Diffusionのインストール方法

2) モデル運用の原則

  • 用途に応じたモデル選択(例)NovelAI/Anything/WD/トリナート/写真系
  • モデル名をファイルで明示し、生成条件(seed/CFG/steps/サンプラ)を記録

3) プロンプト設計(基本形)

  • Positive(品質/被写体/状況/構図)
    • masterpiece, best quality, 1girl, solo, [被写体詳細], [状況], [構図]
  • Negative(破綻除去)
    • lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, jpeg artifacts, signature, watermark, username, blurry
  • 重み付け
    • (word:1.2) で強調、[word] で弱める、((((word)))) は強いフォーカス

4) よく使う要素

  • 構図/人数: 1girl/2girls, solo, from above/below, looking at viewer, portrait, full body
  • シーン: bathing, in cup, classroom, beach, night, street
  • 小道具/衣装: holding instrument, skirt lift, capelet, polka dot
  • NSFW/修辞は自己責任で(配布/公開範囲は法と規約順守)

5) Highres.fix / img2img

  • 大きな解像度は Highres.fix を使用(NovelAI系は 768x768 までがネイティブ)
  • img2img で「構図を維持しつつディテール改善」→ 同プロンプト再利用でバリエーション生成

6) トラブルシューティング

症状原因対策
手/指の破綻モデル/解像/ネガ不足解像度UP、ネガ増強、手専用LoRAの活用
意図しないタグ暴走ネガ不足/競合タグネガに当該タグを追加、タグの削除順序を見直し
文字が潰れるモデル特性/サイズ不足別モデルで再生成、サイズUP、Inpaintで修正

参考資料

関連ノート