FLUX Nedir?
FLUX, Black Forest Labs tarafından geliştirilen yeni nesil bir görsel üretim modelidir. Stable Diffusion'ın yaratıcılarından olan ekip, FLUX ile daha yüksek kalite, daha iyi metin anlama ve daha doğal görseller üreten bir model ortaya koymuştur. 2024 yılında piyasaya sürülen FLUX, özellikle fotoğrafik gerçekçilik ve metin render konusunda rakiplerinin önüne geçmiştir.
FLUX'un öne çıkan özellikleri: - **Metin anlama:** Karmaşık ve uzun promptları çok iyi anlayabilir - **Metin render:** Görsellerin içine yazı yazmak (tabelalar, posterler vb.) konusunda en başarılı modellerden biri - **Doğal görünüm:** İnsan yüzleri, eller ve anatomide daha az hata - **Çeşitli stiller:** Fotoğraftan illüstrasyona, anime'den 3D render'a geniş yelpaze
FLUX Varyantları
FLUX üç farklı versiyonda sunulur:
**FLUX.1 Schnell (Hızlı):** - Apache 2.0 lisansı (ücretsiz, ticari kullanıma açık) - 1-4 adımda görsel üretebilir - En hızlı versiyon, gerçek zamanlı uygulamalar için ideal - Kalitede küçük fedakarlıklar var ama hız avantajı büyük - Yerel kullanım ve kişisel projeler için önerilir
**FLUX.1 Dev (Geliştirici):** - Açık ağırlıklı, ticari olmayan kullanım için ücretsiz - 20-30 adımda yüksek kaliteli görseller üretir - Pro modeline en yakın kaliteyi sunar - ComfyUI ve diğer yerel arayüzlerde kullanılabilir - Topluluk tarafından ince ayar (fine-tune) yapılabilir
**FLUX.1 Pro:** - Sadece API üzerinden erişilebilir (Replicate, fal.ai, Together AI) - En yüksek kalite - Ticari kullanıma uygun - Kurumsal projeler ve prodüksiyon ortamları için
Prompt Yazma Teknikleri
FLUX, doğal dil promptlarını çok iyi anlayan bir modeldir. Diğer modellerdeki gibi virgülle ayrılmış etiket listeleri yerine, akıcı cümleler kullanabilirsiniz:
**Etiket stili (eski yöntem):** "beautiful woman, long hair, sunset, beach, photorealistic, 8k, professional photo"
**Doğal dil (FLUX için ideal):** "A young woman with flowing long hair walks along a sandy beach at sunset. The warm golden light illuminates her face as gentle waves crash behind her. Shot in the style of a professional fashion editorial with shallow depth of field."
FLUX prompt ipuçları: - Sahneyi detaylı tanımlayın, bir hikaye anlatın - Işık koşullarını açıkça belirtin - Kamera açısını ve lens tipini belirtin ("shot on 35mm lens", "aerial drone perspective") - Metin eklemek istiyorsanız çift tırnak kullanın: a sign that reads "Hello World" - Negatif prompt'a genellikle ihtiyaç duyulmaz, FLUX temiz çıktılar verir
Parametre Ayarları
**FLUX.1 Dev için önerilen ayarlar:** - Steps: 20-30 (20 çoğu durum için yeterli) - CFG: 1.0 (FLUX düşük CFG ile çalışır, 3.5-7 arası Guidance önerilir) - Sampler: Euler - Scheduler: Normal veya Simple - Resolution: 1024x1024, 1024x768 veya 768x1024
**FLUX.1 Schnell için:** - Steps: 1-4 (4 adım en iyi kaliteyi verir) - CFG: 1.0 - Diğer ayarlar aynı
Dikkat: FLUX, Stable Diffusion modellerinden farklı bir CFG davranışı gösterir. Yüksek CFG değerleri (7+) kötü sonuçlara yol açar. Bunun yerine "guidance" parametresini kullanın.
API Kullanımı
FLUX'u API üzerinden kullanmak istiyorsanız birkaç seçenek var:
**Replicate:** Replicate platformunda FLUX modellerini doğrudan çalıştırabilirsiniz. Python örneği:
- replicate kütüphanesini pip ile kurun - API token'ınızı ayarlayın - replicate.run fonksiyonu ile modeli çağırın - Prompt ve parametreleri input olarak gönderin
**fal.ai:** fal.ai daha düşük fiyatlandırma ve hızlı inference sunar. WebSocket desteği ile gerçek zamanlı uygulamalar geliştirebilirsiniz.
**Together AI:** Batch işlemler ve yüksek hacimli kullanım için uygun fiyatlı bir alternatiftir.
FLUX LoRA ve Fine-Tune
FLUX modeli üzerinde LoRA eğitimi yaparak kendi stilinizi veya kavramınızı öğretebilirsiniz:
- **AI Toolkit (kohya):** FLUX LoRA eğitimi için en popüler araç - **Eğitim süresi:** 8GB+ VRAM ile yaklaşık 1-2 saat (20-30 görsel için) - **Veri hazırlama:** Tutarlı stil ve kalitede 15-30 görsel yeterli - **Civitai'de hazır LoRA'lar:** Topluluk tarafından eğitilmiş yüzlerce FLUX LoRA mevcut
FLUX.2 ve Gelecek
Black Forest Labs, FLUX.2 üzerinde çalışmaktadır. Beklenen yenilikler: - Daha yüksek çözünürlük (2K ve 4K doğal destek) - Video üretimi entegrasyonu - Daha iyi karakter tutarlılığı - Gelişmiş inpainting ve outpainting - Çoklu dil desteği (İngilizce dışı promptlarda iyileşme)