AnimateDiff mevcut SD modelleriyle nasıl çalışır?

AnimateDiff, Stable Diffusion modelinin mevcut mekansal katmanları arasına zamansal dikkat katmanları (hareket modülü) ekler. Mekansal katmanlar donmuş ve değişmemiş kalır, modelin orijinal görsel kalitesini ve stilini korur. Zamansal katmanlar video verilerinden hareket kalıplarını öğrenir. Bu tak-çalıştır tasarımı, AnimateDiff'i herhangi bir SD 1.5 modeli, LoRA veya özel kontrol noktasıyla ek eğitim olmadan kullanabileceğiniz anlamına gelir.

Motion LoRA'lar, yakınlaştırma, uzaklaştırma, sola kaydırma, sağa kaydırma, eğme ve döndürme gibi belirli kamera veya konu hareketi türlerini üretmek üzere eğitilmiş hafif adaptörlerdir. Normal LoRA'lara benzer şekilde çalışırlar ancak görsel stil yerine zamansal (hareket) yönlerini etkilerler. Motion LoRA'lar birbirleriyle ve normal stil LoRA'larıyla birleştirilebilir ve hem görsel görünüm hem de hareket dinamikleri üzerinde hassas kontrol sağlar.

AnimateDiff kaç kare üretir?

AnimateDiff genellikle temel modelin çözünürlüğünde (SD 1.5 için 512x512, SDXL için 1024x1024) klip başına 16-32 kare üretir. 8fps'de bu 2-4 saniyelik klipler üretir. Kare sayısı ayarlanabilir ancak daha yüksek sayılar kaliteyi düşürebilir veya VRAM sınırlarını aşabilir. Daha uzun animasyonlar için birden fazla klip üretilip birleştirilebilir veya uzatılmış diziler için zamansal kayan pencere tekniği kullanılabilir.

AnimateDiff SDXL ile çalışır mı?

AnimateDiff başlangıçta SD 1.5 modelleri için tasarlanmıştır ve o mimari için en güçlü desteğe ve en büyük hareket modülü koleksiyonuna sahiptir. SDXL desteği topluluk çabaları ve resmi güncellemeler aracılığıyla eklenmiştir, ancak hareket modülü ekosistemi SDXL için daha az olgun durumdadır. SDXL'in daha yüksek çözünürlük ve hesaplama gereksinimleri AnimateDiff'i daha kaynak yoğun kılar.

AnimateDiff için hangi donanım gerekli?

SD 1.5 AnimateDiff için 512x512'de 16 karelik animasyonlar için genellikle 8-12GB VRAM yeterlidir. 32 karelik üretim veya daha yüksek çözünürlükler için 12-16GB VRAM önerilir. SDXL AnimateDiff 16-24GB VRAM gerektirir. Üretim süresi kare sayısına, çözünürlüğe ve GPU'ya bağlı olarak 30 saniye ile birkaç dakika arasında değişir. NVIDIA RTX 3060 12GB veya daha iyisi çoğu iş akışı için rahat performans sağlar.

AnimateDiff açık kaynak mı?

Evet, AnimateDiff Apache 2.0 lisansı altında tamamen açık kaynaklıdır. Hareket modülü ağırlıkları, eğitim kodu ve çıkarım betikleri GitHub ve Hugging Face üzerinde halka açıktır. Topluluk tarafından eğitilmiş hareket modülleri ve Motion LoRA'lar da serbestçe mevcuttur. Proje ComfyUI ve Hugging Face Diffusers'a kapsamlı şekilde entegre edilmiş olup popüler AI sanat iş akışları aracılığıyla erişilebilirdir.

AnimateDiff

Açık Kaynak

4.5

Yuwei Guo

AnimateDiff, Yuwei Guo tarafından geliştirilen ve mevcut mimariye öğrenilebilir zamansal dikkat katmanları ekleyerek herhangi bir kişiselleştirilmiş text-to-image difüzyon modelini video üreticisine dönüştüren bir hareket modülü çerçevesidir. Temmuz 2023'te yayınlanan AnimateDiff, hareket öğrenimini görsel görünüm öğreniminden ayırarak video üretimine çığır açıcı bir yaklaşım getirmiş ve kullanıcıların ince ayarlanmış Stable Diffusion modellerinin ve LoRA adaptasyonlarının geniş ekosistemini yeniden eğitim olmadan video oluşturmak için kullanmasına olanak tanımıştır. Temel yenilik, video verilerinden genel hareket kalıplarını öğrenen ve herhangi bir Stable Diffusion kontrol noktasına eklenerek o kontrol noktasının belirli görsel stilini ve kalitesini korurken çıktılarını canlandırabilen tak-çıkar bir hareket modülüdür. Hareket modülü, kareler arası öz dikkat içeren zamansal transformer blokları içerir ve nesnelerin doğal hareket ettiği ve sahne dinamiklerinin tutarlı kaldığı zamansal olarak tutarlı dizilerin üretilmesini sağlar. AnimateDiff, her mimari için optimize edilmiş farklı hareket modülü sürümleriyle hem SD 1.5 hem de SDXL temel modellerini destekler. Çerçeve, özelleştirilebilir kare sayıları, kare hızları ve hareket yoğunlukları ile animasyonlu GIF'ler ve kısa video döngüleri üretmeyi sağlar. Kullanıcılar AnimateDiff'i poz rehberli animasyon için ControlNet, referans tabanlı hareket için IP-Adapter ve stile özgü video üretimi için çeşitli LoRA modelleriyle birleştirebilir. Yaygın uygulamalar arasında animasyonlu sanat eserleri oluşturma, sosyal medya içeriği, oyun varlık animasyonu, ürün görselleştirme ve yaratıcı hikaye anlatımı dizileri yer alır. Apache 2.0 lisansı altında sunulan AnimateDiff, Hugging Face, Replicate ve fal.ai üzerinde erişilebilir olup ComfyUI iş akışları ve Automatic1111 uzantıları aracılığıyla kapsamlı topluluk desteğine sahiptir. Çerçeve, yaratıcıların emsalsiz esneklik ve kontrolle stilize animasyonlu içerik üretmesini sağlayarak en etkili açık kaynak video üretim yaklaşımlarından biri haline gelmiştir.

Metinden Video

Görselden Video

Siteyi Ziyaret Et

Öne Çıkan Özellikler

Tak-Çalıştır Hareket Modülü

Herhangi bir Stable Diffusion modeline modele özgü eğitim gerektirmeden hareket ekleme yeteneği sunan evrensel hareket modülü.

LoRA ve Özel Model Uyumluluğu

Topluluk LoRA'ları, DreamBooth modelleri ve özel kontrol noktaları dahil tüm SD 1.5 ekosistemiyle uyumlu çalışır.

Hareket LoRA Kalıpları

Yakınlaştırma, kaydırma ve döndürme gibi belirli kamera hareketleri için özelleştirilmiş hareket LoRA'ları ile hassas kontrol.

SparseCtrl Kare Koşullandırma

AnimateDiff v3 ile belirli kareleri koşullandırarak animasyonun başlangıç ve bitiş noktalarını kontrol edebilme yeteneği.

Hakkında

AnimateDiff, Hong Kong Çin Üniversitesi ve Shanghai AI Laboratuvarı'ndan Yuwei Guo, Ceyuan Yang ve meslektaşları tarafından geliştirilen ve Temmuz 2023'te tanıtılan, kişiselleştirilmiş metinden görsele difüzyon modellerini canlandırmak için pratik bir çerçevedir. AnimateDiff'in temel yeniliği, tak-çalıştır hareket modülü aracılığıyla modele özgü ayar gerektirmeden herhangi bir kişiselleştirilmiş Stable Diffusion modeline (LoRA ve DreamBooth ince ayarlı modeller dahil) hareket ekleme yeteneğidir. Bu yaklaşım, video üretimi alanında paradigma değiştirici bir etki yaratmış ve binlerce mevcut Stable Diffusion modelini animasyon yetenekleriyle donatarak topluluğun yaratıcı olanaklarını muazzam şekilde genişletmiştir.

Mimari, donmuş temel metinden görsele modeline eklenen zamansal dikkat katmanlarından oluşan bir hareket modülü sunar. Bu zamansal katmanlar mekansal katmanlar değişmeden kalırken video verilerinden hareket kalıplarını öğrenir ve orijinal modelin görsel kalitesini ve stilini korur. Bu ayrıştırılmış tasarım, bir kez eğitilen hareket modülünün topluluk ince ayarlı modeller, LoRA'lar ve özel kontrol noktaları dahil herhangi bir SD 1.5 veya SDXL modeline uygulanabileceği anlamına gelir. Zamansal dikkat mekanizması, kareler arası bilgi akışını sağlayarak hareketin doğal ve tutarlı olmasını garanti eder ve bu sayede üretilen animasyonlarda titreme veya atlama gibi sorunlar en aza indirilir.

AnimateDiff birden fazla sürüm aracılığıyla gelişmiştir: v1 temel hareket modülünü tanıtmış, v2 hareket kalitesini iyileştirmiş ve belirli hareket kalıpları için hareket LoRA'ları eklemiş ve v3 (SparseCtrl) belirli kareler için koşullandırma kontrolü eklemiştir. SparseCtrl özellikle önemlidir çünkü kullanıcıların animasyonun belirli karelerinde istenen pozları veya sahneleri belirlemesine olanak tanır ve bu sayede çok daha kontrollü ve öngörülebilir animasyon üretimi mümkün hale gelir. Bu özellik özellikle hikaye anlatımı ve sıralı animasyon projeleri için büyük önem taşımaktadır. Çerçeve genellikle temel modelin çözünürlüğünde 16-32 karelik kısa animasyon klipleri üretir ve bu klipler döngüsel animasyonlar için de optimize edilebilir.

Hareket LoRA'ları, AnimateDiff ekosisteminin en güçlü yönlerinden biridir. Yakınlaştırma, uzaklaştırma, kamera kaydırma, döndürme ve karakter hareketi gibi belirli hareket türlerinde uzmanlaşmış küçük eklenti modülleri, topluluk tarafından sürekli olarak geliştirilmektedir. Kullanıcılar birden fazla hareket LoRA'sını birleştirerek karmaşık kamera hareketleri ve sahne dinamikleri oluşturabilir. Bu modüler yaklaşım, AnimateDiff'i video üretiminde benzersiz bir esneklik düzeyine ulaştırmıştır ve bağımsız video modellerinin sunamayacağı bir özelleştirme derinliği sağlar.

AnimateDiff, özel iş akışı düğümleriyle ComfyUI'ye kapsamlı şekilde entegre edilmiş ve Hugging Face Diffusers aracılığıyla mevcuttur. Automatic1111 WebUI için de topluluk uzantıları bulunmaktadır ve bu entegrasyonlar projeyi en popüler Stable Diffusion arayüzleri içinde kolayca erişilebilir kılar. Apache 2.0 lisansı altında açık kaynaklı olan AnimateDiff, mevcut Stable Diffusion modellerinden AI animasyonları oluşturmak için en popüler yöntemlerden biri haline gelmiştir. Topluluk tarafından geliştirilen yüzlerce özel hareket modülü ve iş akışı, projenin etkisini ve erişimini sürekli genişletmektedir.

Pratik kullanım alanları arasında sosyal medya animasyonları, karakter canlandırma, ürün tanıtım videoları, sanatsal animasyonlar ve kısa film prodüksiyonu yer alır. AnimateDiff'in eklenti mimarisi, mevcut Stable Diffusion ekosisteminin tüm gücünden yararlanan benzersiz bir video üretim yaklaşımını temsil eder ve bu alandaki en etkili açık kaynak projelerinden biri olarak konumunu güçlü şekilde korumakta, her geçen gün artan topluluk desteğiyle gelişmeye devam etmektedir.

Kullanım Senaryoları

Mevcut SD Modellerini Canlandırma

Favori Stable Diffusion modellerinizi ve LoRA'larınızı kullanarak animasyonlu içerik oluşturma.

Kısa Animasyon Klipleri

Sosyal medya ve portfolio için kısa animasyonlu sanat eserleri üretme.

Karakter Animasyonu

DreamBooth veya LoRA ile eğitilmiş özel karakterleri canlandırma.

Kamera Hareketi Efektleri

Motion LoRA'lar ile yakınlaştırma, kaydırma ve döndürme gibi sinematik kamera hareketleri oluşturma.

Artılar ve Eksiler

Artılar

Stable Diffusion ekosistemindeki binlerce checkpoint, LoRA ve ControlNet'i video üretimi için kullanılabilir hale getirir
Mevcut text-to-image modellerle sorunsuz entegrasyon; ek eğitim gerektirmez
Görsel kaliteyi ve hareket çeşitliliğini koruyarak zamansal olarak pürüzsüz animasyon klipleri üretir
Anime ve illüstrasyon stillerinde uzmanlaşmıştır; bu alanlarda özelleşmiş modellerle etkin rekabet eder
SD 1.5 tabanlı üretimler 8GB VRAM ile çalışabilir

Eksiler

Fotorealistik video üretiminde amaca yönelik video modellerine kıyasla yetersiz kalır
Yüz detayları daha yumuşak, hareket daha az akıcı ve zamansal tutarlılık bazen bozulabilir
AnimateDiff Lightning hızlı sonuç verir ancak detaylı animasyonlarda kalite düşüklüğü belirgindir
SDXL tabanlı üretimler 12-16GB VRAM gerektirir
Düşük örnekleme adımları hızı artırır ancak detay feda edilir; yüksek adımlar ise süreyi uzatır

Teknik Detaylar

Parametre

N/A

Lisans

Apache 2.0

Özellikler

Plug-and-Play Motion Module
Compatible with Any SD Model
LoRA and DreamBooth destek
Motion LoRA Patterns
Temporal Attention katman
16-32 Frame animasyon
SparseCtrl Frame Conditioning
ComfyUI Native entegrasyon

Benchmark Sonuçları

Metrik	Değer	Karşılaştırma	Kaynak
Motion Module Boyutu	~400MB	SVD Motion: ~1.5B params total	AnimateDiff GitHub / Hugging Face
Video Çözünürlüğü	512x512 (v1-v2), 1024x1024 (v3/SDXL)	SVD: 1024x576	AnimateDiff GitHub
Kare Sayısı	16 kare (default)	SVD: 14-25 kare	AnimateDiff Paper (arXiv:2307.04725)
FPS	8 fps	ModelScope T2V: 8 fps	AnimateDiff GitHub

Mevcut Platformlar

hugging face

replicate

fal ai

Haberler ve Referanslar

AnimateDiff v3, SparseCtrl ile geliştirilmiş kontrol sunuyor

GitHub · 2024-02

Sıkça Sorulan Sorular

İlgili Modeller

Sora

OpenAI|N/A

Sora, OpenAI'nın metin açıklamalarından, sabit görsellerden veya mevcut video girdilerinden bir dakikaya kadar gerçekçi ve yaratıcı video içeriği oluşturabilen çığır açıcı text-to-video üretim modelidir. Şubat 2024'te duyurulan Sora, olağanüstü zamansal tutarlılık ve görsel sadakatle fiziksel dünyayı hareket halinde anlama ve simüle etme konusunda benzeri görülmemiş bir yetenek sergileyerek video üretim yapay zekasında büyük bir ilerlemeyi temsil eder. Model, değişen sürelerde, çözünürlüklerde ve en boy oranlarında geniş bir video ve görsel veri kümesi üzerinde eğitilmiş bir difüzyon transformer olarak çalışır ve kırpma veya yeniden boyutlandırma olmadan birden fazla formatta içerik üretebilir. Sora; karmaşık kamera hareketleri, tutarlı görünümlere sahip birden fazla karakter, doğru aydınlatma ve yansımalarla detaylı ortamlar ve nesneler arasında fiziksel olarak makul etkileşimler içeren videolar üretebilir. Model, üretilen sahnelerde 3B tutarlılık, nesne kalıcılığı ve neden-sonuç ilişkilerini anlama konusunda ortaya çıkan yetenekler sergiler. Metinden videoya üretimin ötesinde Sora; görselden videoya animasyon, video uzatma, videodan videoya stil transferi ve sorunsuz geçişlerle birden fazla video segmentini birleştirme özelliklerini destekler. Model, fotorealistik görüntülerden animasyonlu içeriğe, mimari görselleştirmelerden soyut sanatsal kompozisyonlara kadar geniş bir yaratıcı stil yelpazesini yönetir. Tescilli bir model olan Sora, kullanım tabanlı fiyatlandırma ve içerik güvenliği filtrelemesiyle yalnızca OpenAI platformu üzerinden erişilebilir durumdadır. Model zaman zaman karmaşık fizik simülasyonlarında zorlanıp uzun dizilerde artefaktlar üretebilse de genel kalitesi ve çok yönlülüğü, onu video üretim yeteneği için bir referans noktası haline getirmiş ve dinamik görsel içerik oluşturmada yapay zekanın sınırlarını zorlamıştır.

Tescilli

4.9

Runway Gen-3 Alpha

Runway|N/A

Runway Gen-3 Alpha, Runway tarafından geliştirilen ve üretilen video içeriği üzerinde ince taneli zamansal ve görsel kontrol sunan gelişmiş bir video üretim modelidir. Şirketin önceki Gen-1 ve Gen-2 modellerinden önemli bir evrim temsil eder. Haziran 2024'te yayınlanan Gen-3 Alpha, hem uzamsal kompozisyon hem de zamansal dinamikler hakkında derin bir anlayış geliştirmek için görüntüler ve videolar üzerinde birlikte eğitilmiş olup öncüllerine kıyasla önemli ölçüde iyileştirilmiş hareket tutarlılığı, görsel sadakat ve prompt uyumu sunar. Model, hem metinden videoya hem de görselden videoya üretim modlarını destekleyerek kullanıcıların detaylı metin açıklamalarından video içeriği oluşturmasına veya mevcut durağan görselleri doğal, fiziksel olarak makul hareketlerle canlandırmasına olanak tanır. Gen-3 Alpha, kullanıcıların sezgisel metin tabanlı veya parametrik kontroller aracılığıyla kaydırma, eğme, yakınlaştırma ve takip çekimleri dahil kamera hareketlerini belirlemesini sağlayan gelişmiş kamera kontrol yetenekleri sunar. Model, kareler arasında tutarlı karakter görünümlerini koruma, birden fazla hareketli öğeye sahip karmaşık sahnelerde zamansal tutarlılığı sürdürme ve metin istemlerinden nüanslı yaratıcı yönlendirmeyi doğru yorumlama konularında üstün performans gösterir. Fotorealistik görüntüler, sinematik kompozisyonlar, stilize animasyon ve sanatsal yorumlar dahil çeşitli görsel stilleri profesyonel kalitede yönetir. Model ayrıca yerelleştirilmiş hareket kontrolü için hareket fırçası işlevselliği ve mevcut kliplerin sorunsuz şekilde devam ettirilmesi için video uzatma desteği sunar. Yalnızca Runway platformu üzerinden erişilebilen tescilli bir model olan Gen-3 Alpha, çeşitli abonelik katmanlarıyla kredi tabanlı bir fiyatlandırma sistemiyle çalışır. Daha önce kapsamlı canlı çekim veya karmaşık CGI üretim süreçleri gerektiren video içeriği için hızlı prototipleme ve üretim aracı olarak sinemacılar, içerik üreticileri, reklam profesyonelleri ve yaratıcı ajanslar tarafından yaygın şekilde benimsenmiştir.

Tescilli

4.8

Veo 3

Google DeepMind|Unknown

Veo 3, Google DeepMind'in metin açıklamalarından doğal sesle birlikte yüksek kaliteli video içeriği üretebilen en gelişmiş video üretim modelidir. Model, dikkat çekici zamansal tutarlılık, akıcı hareket ve gerçekçi fizik simülasyonuyla 4K çözünürlüğe kadar videolar üretir. En ayırt edici özelliği, görsel içerikle eşleşen ortam sesleri, müzik, diyalog ve ses efektleri dahil video ile eşzamanlı ses üretebilmesidir; bu, ayrı ses üretimi ihtiyacını ortadan kaldırır. Dolly çekimleri, pan ve zoom gibi kamera hareketleri, aydınlatma koşulları, alan derinliği ve film grenli efektler dahil sinematik kavramları anlayarak promptlarda profesyonel düzeyde sinematografik yönlendirmeler sağlar. Veo 3, tutarlı etkileşimlerle karmaşık çok özneli sahneleri ele alır, kliplerde karakter tutarlılığını korur ve eylemler ile pozlar arasında doğal geçişler üretir. Mimari, Google DeepMind'in difüzyon transformer uzmanlığı üzerine inşa edilmiş olup fotorealistik görüntülerden animasyona ve sanatsal yorumlamalara kadar geniş stilistik yelpaze için çeşitli video veri setleri üzerinde büyük ölçekli eğitimden yararlanır. Video çıktıları düzgün zamansal tutarlılıkla birden fazla saniyeye uzanır. Google'ın AI platformları aracılığıyla ve Google ekosistemindeki yaratıcı araçlara entegre olarak sunulur. Reklam içerik oluşturma, sosyal medya video üretimi, film ön görselleştirmesi, eğitim içeriği ve yaratıcı hikaye anlatımı başlıca uygulama alanlarıdır. Veo 3, üretken video alanında kalite, ses entegrasyonu ve prompt anlama konusunda yeni standartlar belirleyen güncel son teknolojiyi temsil eder.

Tescilli

4.9

Runway Gen-4 Turbo

Runway|Unknown

Runway Gen-4 Turbo, Runway'in seleflerine kıyasla önemli ölçüde geliştirilmiş hız, görsel sadakat ve hareket tutarlılığıyla yüksek kaliteli AI üretimi video oluşturmak için tasarlanmış en hızlı ve en gelişmiş video üretim modelidir. Metin açıklamaları ve görsel girdilerden geliştirilmiş zamansal tutarlılıkla video üretir; klip boyunca özne bütünlüğünü koruyan akıcı ve doğal hareketler oluşturur. Gen-4 Turbo, önceki Runway modellerine göre önemli ölçüde daha hızlı çıkarım sunarak hızlı geri bildirimin zorunlu olduğu iteratif yaratıcı iş akışları için pratik bir çözüm sağlar. Gerçekçi vücut mekaniği ve yüz ifadeleriyle insan figürleri, dinamik öğeler içeren doğal çevreler, doğru perspektifle mimari sahneler ve soyut sanatsal kompozisyonlar dahil çeşitli içerik türlerini ele alır. Açıklamalardan klip oluşturmak için metinden videoya, durağan görselleri hareketlendiren görselden videoya ve mevcut görüntülere stil dönüşümleri uygulayan videodan videoya dahil birden fazla üretim modunu destekler. Mimari, Runway'in video difüzyon araştırmasını temel alır ve fiziksel olarak makul sonuçlar üreten zamansal dikkat mekanizmaları ile hareket modelleme ilerlemelerini birleştirir. Runway'in web platformu ve API'si aracılığıyla yaratıcı uygulamalar için entegrasyon seçenekleriyle sunulur. Ticari içerik oluşturma, sosyal medya video üretimi, müzik videosu konseptleri, film ön görselleştirmesi, ürün reklamcılığı ve hareket tasarımı başlıca profesyonel kullanım alanlarıdır. Runway abonelik katmanları içinde kredi tabanlı fiyatlandırma sistemiyle çalışır. Gen-4 Turbo, yaratıcılara geleneksel üretim altyapısı olmadan çekici video içerik üretme imkanı sunan profesyonel araçlar sunarak Runway'in öncü konumunu sağlamlaştırır.

Tescilli

4.7

Hızlı Bilgi

ParametreN/A

Tipdiffusion

LisansApache 2.0

Yayınlanma2023-07

Puan4.5 / 5

GeliştiriciYuwei Guo

Bağlantılar

Resmi Site GitHub arXiv Paper HuggingFace

Etiketler

animatediff

motion

animation

text-to-video

Siteyi Ziyaret Et

Daha Fazla Kesfet

Tum Metinden Video Modelleri

Kategoriyi incele

AI Video Üretimi: Başlangıç Rehberi

Rehberi oku

Tum AI Modelleri

Tum modelleri incele

AnimateDiff

Öne Çıkan Özellikler

Tak-Çalıştır Hareket Modülü

LoRA ve Özel Model Uyumluluğu

Hareket LoRA Kalıpları

SparseCtrl Kare Koşullandırma

Hakkında

Kullanım Senaryoları

Mevcut SD Modellerini Canlandırma

Kısa Animasyon Klipleri

Karakter Animasyonu

Kamera Hareketi Efektleri

Artılar ve Eksiler

Artılar

Eksiler

Teknik Detaylar

Özellikler

Benchmark Sonuçları

Mevcut Platformlar

Haberler ve Referanslar

Sıkça Sorulan Sorular

AnimateDiff mevcut SD modelleriyle nasıl çalışır?

Motion LoRA nedir?

AnimateDiff kaç kare üretir?

AnimateDiff SDXL ile çalışır mı?

AnimateDiff için hangi donanım gerekli?

AnimateDiff açık kaynak mı?

İlgili Modeller

Sora

Runway Gen-3 Alpha

Veo 3

Runway Gen-4 Turbo

Hızlı Bilgi

Bağlantılar

Etiketler

Daha Fazla Kesfet