İleri
AI Görsel Üretimi
12 dk okuma

Stable Diffusion Parametre Rehberi

Temel Parametreleri Anlamak

Stable Diffusion'da görsel kalitesini belirleyen birkaç kritik parametre vardır. CFG Scale (Classifier Free Guidance), AI'ın prompt'u ne kadar sıkı takip edeceğini belirler; 7-12 arası değerler çoğu durum için idealdir. Düşük değerler (1-5) daha yaratıcı ama prompt'tan sapan sonuçlar verirken, yüksek değerler (15+) aşırı doymuş ve artefactlı görüntüler üretebilir. Sampling Steps, görüntünün ne kadar süre işleneceğini belirler; 20-30 adım genellikle yeterlidir, 50+ adım marjinal iyileşme sağlar.

Sampler Seçimi

Her sampler (örnekleyici) farklı görsel karakteristikler üretir. DPM++ 2M Karras, yüksek kaliteli ve tutarlı sonuçları ile en popüler seçimdir. Euler A, yaratıcı ve çeşitli çıktılar için kullanışlıdır ama seed bazlı tutarsızlık gösterebilir. DDIM, daha deterministik sonuçlar ve interpolasyon için uygundur. UniPC, hız ve kalite dengesi açısından 2023 itibarıyla öne çıkan bir seçenektir. Sampler deneyimlemesi için aynı seed ve prompt ile farklı sampler'ları karşılaştırmanız önerilir.

Model ve LoRA Kullanımı

Stable Diffusion'ın gücü, farklı checkpoint modellerinden ve LoRA (Low-Rank Adaptation) ağırlıklarından gelir. Civitai.com, binlerce kullanıcı tarafından eğitilmiş model ve LoRA barındırır. Gerçekçi fotoğrafçılık için Realistic Vision veya epiCRealism modellerini; anime tarzı için ToonYou veya Counterfeit modellerini kullanabilirsiniz. LoRA'lar belirli karakterler, stiller veya kavramlar için model üzerine ince ayar yapar; örneğin bir sanatçının stilini veya belirli bir karakteri yeniden üretmek için kullanılır.

ControlNet ile Hassas Kontrol

ControlNet, görsel üretiminde devrim yaratan bir uzantıdır. Canny edge detection ile bir görselin ana hatlarını koruyarak yeni içerik üretebilirsiniz. Pose kontrolü için OpenPose kullanarak bir karakterin vücut pozisyonunu kilitleyebilirsiniz. Depth map ile görüntünün derinlik yapısını koruyarak stil transferi uygulayabilirsiniz. Inpainting ile görselin belirli bölgelerini değiştirirken geri kalanını koruyabilirsiniz. Bu araçları birleştirerek insan anatomisi, mimari tutarlılık ve komposizyon üzerinde tam kontrol elde edersiniz.

Parametre Kombinasyonu Rehberi

Biz yuzlerce kombinasyon test ettik ve farklı kullanım senaryolari için ideal ayar setlerini belirledik:

**Fotorealistik Portre:** - Model: Realistic Vision v5.1 veya epiCRealism - Sampler: DPM++ 2M Karras - Steps: 28-35 - CFG Scale: 7-8 - Negatif prompt: "cartoon, painting, illustration, worst quality, low quality, bad anatomy, deformed, extra limbs"

**Anime / Illustrasyon:** - Model: ToonYou veya Counterfeit v3 - Sampler: DPM++ SDE Karras - Steps: 25-30 - CFG Scale: 8-10 - Negatif prompt: "photorealistic, 3d render, worst quality, bad proportions, extra fingers"

**Mimari / Ic Mekan:** - Model: Dreamshaper veya Juggernaut XL - Sampler: DPM++ 2M Karras - Steps: 30-40 - CFG Scale: 7-9 - Negatif prompt: "people, blurry, low quality, distorted, watermark"

**Konsept Sanat:** - Model: DreamShaper XL veya SDXL base - Sampler: Euler A - Steps: 30-35 - CFG Scale: 8-10 - Negatif prompt: "photorealistic, low quality, blurry, text, watermark"

Bu ayarlari başlangıç noktasi olarak kullanin ve kendi ihtiyaciniza gore ince ayar yapin.

Çözünürlük ve Upscale Stratejileri

Stable Diffusion'da çözünürlük performans ve kalite arasindaki dengeyi belirler. Onerdigimiz yaklaşım:

- **Başlangıç çözünürlüğü:** SD 1.5 modelleri için 512x512 veya 512x768; SDXL modelleri için 1024x1024 veya 1024x1280 kullanin. Bu boyutlarin disina cikmak artefact üretebilir. - **Hires Fix:** Ilk nesil düşük cozunurlukta yapılır, ardindan 2x buyutme ile detaylar eklenir. Denoising strength 0.3-0.5 arasi iyi bir baslangictir. - **Upscale modelleri:** 4x-UltraSharp ve ESRGAN-4x fotorealistik görüntüler için idealdir. Anime iceriklerde 4x-AnimeSharp tercih edin. - **Tiled upscale:** Cok büyük cozunurlukler (4K+) için tiled VAE ve tiled upscale kullanin; bu VRAM tuketimini azaltir.

Adim Adim: Ilk Gorselden Profesyonel Ciktiya

Simdi siz deneyin! Bu adimlari sirayla takip edin:

1. **Temel görsel:** Basit bir prompt yazin (ornegin "a serene mountain lake at sunset"). CFG 7, Steps 25, DPM++ 2M Karras sampler ile uretin. Sonucu inceleyin. 2. **CFG karşılaştırma:** Ayni prompt ve seed ile CFG 3, 7, 12 ve 18 degerlerini deneyin. Farki gozlemleyin — düşük CFG daha ruya gibi, yüksek CFG daha keskin ama artefactli olacaktir. 3. **Sampler testi:** Ayni prompt, seed ve CFG ile Euler A, DPM++ 2M Karras ve DDIM sampler'larini karsilastirin. Her birinin karakter farkini not edin. 4. **Negatif prompt ekleyin:** Olustaki sorunlari (ornegin bulaniklik, düşük kalite) negatif prompt'a ekleyerek giderin. 5. **LoRA deneyimi:** Civitai'dan bir stil LoRA'si indirip prompt'a ekleyin. Ayni sahneyi LoRA'li ve LoRA'siz karsilastirin. 6. **Hires Fix:** En begediginiz gorseli Hires Fix ile 2x buyutun. Denoising 0.3 ve 0.5 ile farki gozlemleyin.

SDXL vs SD 1.5: Hangisini Kullanmali?

SDXL (Stable Diffusion XL), SD 1.5'in gelişmiş surumudur ve önemli farklar icerir:

- **Çözünürlük:** SDXL dogal olarak 1024x1024 destekler; SD 1.5 512x512'de en iyi çalışır. - **Detay kalitesi:** SDXL yuzler, eller ve kucuk detaylarda belirgin şekilde daha basarilidir. - **Prompt anlama:** SDXL uzun ve karmasik prompt'lari daha iyi yorumlar. - **VRAM ihtiyaci:** SDXL en az 8GB VRAM gerektirir; SD 1.5 4GB ile calisabilir. - **Model ekosistemi:** SD 1.5 cok daha genis bir LoRA ve model ekosistemine sahiptir.

Onerdigimiz yaklaşım: Güçlü bir GPU'nuz varsa (8GB+ VRAM) SDXL ile baslayin. Sınırlı donanim veya spesifik bir LoRA ihtiyaciniz varsa SD 1.5 hala mukemmel sonuçlar verir.

Sik Sorulan Sorular

**Stable Diffusion için ne kadar VRAM gerekiyor?** SD 1.5 modelleri 4GB VRAM ile calisabilir, ancak 8GB oneriyoruz. SDXL için en az 8GB, ideal olarak 12GB gerekir. ComfyUI ve xformers gibi optimizasyonlarla VRAM tuketimini %30-40 azaltabilirsiniz.

**CFG Scale degerini nasil secmeliyim?** Genel kural: 7 civarinda baslayin. Sonuçlar prompt'a yeterince bagli degilse 9-10'a cikarin. Sonuçlar aşırı doygun veya artefactli ise 5-6'ya dusurun. Her model için ideal CFG biraz farklidir; biz test edip model kartlarindaki onerilen degeri kullanmanizi oneriyoruz.

**Sampling steps artirmak her zaman daha iyi sonuç verir mi?** Hayir. 20-30 steps cogu sampler için optimal bolgedir. 50'nin uzerinde iyilesme ihmal edilebilir duzeydedir ve işlem suresi iki katina cikar. Ancak bazi sampler'lar (Euler A gibi) düşük step sayilarinda bile iyi sonuç verebilirken, digerlerinde (DPM++ 2M Karras) 25+ steps oneriyoruz.

**LoRA dosyalarini nereden bulabilirim?** Civitai.com en büyük ve en aktif LoRA/model paylasim platformudur. Hugging Face da resmi ve topluluk modellerini barindirir. LoRA dosyalarini models/Lora klasorune yerlestirin ve prompt'ta "<lora:dosya_adi:agirlik>" seklinde kullanin; agirlik genellikle 0.5-0.8 arasi en iyi sonucu verir.

Etiketler:
#stable-diffusion
#parametre
#cfg
#sampler
#advanced
#automaticA111

Benzer Rehberler

Tümünü gör