Görsel Düzenleme Modelleri

Görsel Düzenleme için en iyi AI modellerini keşfet

Filtrele

Kategori

Tip

Sırala

2 model bulundu

IC-Light

Lvmin Zhang|1B+

IC-Light (Intrinsic Compositing Light), ControlNet'in yaratıcısı Lvmin Zhang tarafından geliştirilen ve fotoğraflardaki aydınlatma koşullarını olağanüstü gerçekçilikle manipüle eden ve dönüştüren bir AI aydınlatma modelidir. Özelleştirilmiş aydınlatma koşullandırması ile Stable Diffusion omurgası üzerine inşa edilen bir milyardan fazla parametreli model, herhangi bir nesne veya kişi fotoğrafını alarak fotorealistik gölgeleri, vurguları ve yüzey yansımalarını korurken ışık kaynağı yönünü, renk sıcaklığını, yoğunluğunu ve ortam aydınlatmasını tamamen değiştirebilir. IC-Light iki farklı modda çalışır: öznenin bağımsız olarak çıkarılıp yeniden aydınlatıldığı ön plan aydınlatması ve aydınlatmanın yeni bir arka plan ortamına uyacak şekilde ayarlandığı arka plan uyumlu aydınlatma. Model, speküler yansımalar, ciltte yüzey altı saçılma, metalik yüzeyler ve şeffaf malzemeler dahil fiziksel ışık davranışını anlar ve gerçek dünya optik özelliklerine saygı duyan sonuçlar üretir. IC-Light, hedef aydınlatma düzenini tanımlamak için metin açıklamaları veya referans görüntüler kabul ederek nihai görünüm üzerinde sezgisel kontrol sunar. Apache 2.0 lisansı altında tamamen açık kaynaklı olan model, özel iş akışı düğümleriyle ComfyUI'ye entegre edilmiştir. Profesyonel fotoğrafçılar, ürün fotoğrafçıları, dijital sanatçılar ve e-ticaret ekipleri IC-Light'ı mevcut fotoğraflardaki olumsuz aydınlatmayı düzeltmek, günlük çekimlerden stüdyo kalitesinde aydınlatma oluşturmak, katalog görüntüleri arasında ürün aydınlatmasını eşleştirmek ve yaratıcı projeler için dramatik sinematik aydınlatma üretmek amacıyla kullanır.

Açık Kaynak

4.5

InstructPix2Pix v2

UC Berkeley|1.5B

InstructPix2Pix v2, UC Berkeley'de geliştirilen ve doğal dil talimatlarına dayalı olarak görselleri düzenleyen gelişmiş bir difüzyon modelidir. Tim Brooks ve ekibinin orijinal InstructPix2Pix'in başarısı üzerine inşa edilmiştir. Model, bir girdi görüntüsü ve 'gün batımı yap' veya 'kediyi köpeğe dönüştür' gibi bir metin talimatı alarak görüntünün ilgisiz kısımlarını korurken düzenlenmiş sonucu üretir. Talimat ayarlaması ile Stable Diffusion omurgası üzerine inşa edilen v2 sürümü, selefine kıyasla talimat anlama, çıktı kalitesi ve düzenleme hassasiyetinde önemli iyileştirmeler sunar. Mimari, karmaşık çok adımlı talimatları takip etmeyi öğrenir ve stil değişiklikleri, nesne modifikasyonları, renk ayarlamaları, hava durumu dönüşümleri ve kompozisyon değişiklikleri dahil nüanslı düzenleme taleplerini işler. Maske tabanlı düzenleme yaklaşımlarından farklı olarak InstructPix2Pix v2, metin talimatına dayalı olarak görüntünün hangi bölümlerinin değiştirileceğini otomatik olarak belirlediğinden manuel bölge seçimi gerektirmez. Yaklaşık 1,5 milyar parametreli model, 8GB ve üzeri VRAM'e sahip tüketici GPU'larında verimli şekilde çalışır. MIT lisansı altında tamamen açık kaynaklıdır ve ComfyUI ile Diffusers kütüphanesi dahil popüler yaratıcı araçlara entegre edilmiştir. Profesyonel fotoğrafçılar, dijital sanatçılar, e-ticaret ekipleri ve içerik üreticileri hızlı yinelemeli düzenleme, ürün fotoğrafı iyileştirme ve geleneksel manuel düzenlemenin zaman açısından engelleyici olduğu toplu görsel içerik işleme için kullanır.

Açık Kaynak

4.4