txt2img Detaylı Açıklama
txt2img, "text to image" (metinden görsele) ifadesinin kısaltmasıdır ve özellikle Stable Diffusion WebUI (AUTOMATIC1111, ComfyUI) ekosisteminde yaygın olarak kullanılır. Bu mod, yalnızca metin promptu kullanarak sıfırdan görsel üretme işlemini ifade eder; herhangi bir referans görsel gerektirmez.
txt2img modunda kullanıcı bir metin promptu, isteğe bağlı olarak bir negatif prompt, görsel boyutları, adım sayısı, CFG scale (prompt uyum ölçeği) ve sampler/scheduler seçimi gibi parametreleri belirler. Model, tamamen rastgele gürültüden başlayarak bu parametrelere göre bir görsel üretir.
txt2img'nin temel parametreleri şunlardır: Width/Height (görsel boyutu, genellikle 512x512 veya 1024x1024), Steps (gürültü giderme adım sayısı, 20-50 arası), CFG Scale (promptun ne kadar sıkı takip edileceği, 5-15 arası), Seed (rastgelelik tohumu, aynı seed aynı görseli üretir), Sampler (Euler, DPM++ gibi gürültü giderme algoritması).
txt2img, img2img ile karşılaştırıldığında tamamen özgün görseller üretir ancak çıktı üzerinde yapısal kontrol daha sınırlıdır. ControlNet eklenerek txt2img modunda bile yapısal kontrol sağlanabilir.
Pratik bir örnek: Stable Diffusion'ın ComfyUI arayüzünde txt2img iş akışı şu şekilde çalışır: Bir prompt node'u oluşturup "cyberpunk city street at night, neon signs, rain, cinematic" yazarsınız, checkpoint modeli (örneğin SDXL) seçersiniz, sampler parametrelerini (Euler A, 25 steps, CFG 7) ayarlarsınız ve üretim başlatırsınız. Sonuç genellikle 5-15 saniye içinde hazırdır. Flux modelinde ise txt2img süreci daha hızlıdır ve prompt bağlılığı (prompt adherence) daha yüksektir.
tasarım.ai üzerinde txt2img özelliğini doğrudan kullanan araçlar arasında Stable Diffusion (ComfyUI ve Automatic1111 ile tam kontrol) ve Flux (Schnell ile ultra hızlı üretim, Pro ile yüksek kalite) öne çıkar. Midjourney, DALL-E 3, Leonardo AI ve Ideogram da temelde txt2img yapmasına rağmen, bu terimi teknik olarak daha çok Stable Diffusion ekosistemi bağlamında kullanılır.
Yeni başlayanlar için öneri: Txt2img ile başlarken sampler, steps ve CFG scale gibi temel parametreleri öğrenin. Genellikle Euler A sampler, 20-30 steps ve CFG 7-8 değerleri iyi bir başlangıç noktasıdır. Batch count parametresiyle aynı prompttan birden fazla varyasyon üretip en iyisini seçebilirsiniz. Stable Diffusion'ı yerel kurmadan denemek için Google Colab üzerinde çalıştırabilirsiniz.