IDM-VTON (Improving Diffusion Models for Virtual Try-On), Yisol Studio tarafından geliştirilen ve bir kişinin fotoğrafını bir giysi görüntüsüyle birleştirerek son derece gerçekçi sanal kıyafet deneme deneyimi sunan çığır açıcı bir difüzyon tabanlı modeldir. Model, doku, desen, kumaş düşüşü ve yapısal öğeler dahil giysi ayrıntılarını olağanüstü sadakatle yakalayan özelleştirilmiş giysi kodlaması ile Stable Diffusion üzerine inşa edilmiş sofistike iki aşamalı bir mimari kullanır. Bir kişi görüntüsü ve düz serili veya manken giysi fotoğrafı verildiğinde, IDM-VTON kişinin vücut şeklini, cilt tonunu, pozunu ve arka plan bağlamını korurken giysili halini fotorealistik olarak görselleştirir. Model, günlük giyimden resmi kıyafetlere, aksesuarlara ve katmanlı kombinlere kadar çeşitli giysi türlerini dikkat çekici doğrulukla işler. Bir milyardan fazla parametresiyle IDM-VTON, standart sanal deneme kıyaslamalarında son teknoloji sonuçlar elde eder ve gerçek fotoğraflardan sıklıkla ayırt edilemeyen çıktılar üretir. Giysi kodlama modülü, önceki modellerin sıklıkla bulanıklaştırdığı veya kaybettiği logolar, metinler, düğmeler ve dikiş desenleri gibi ince ayrıntıları özellikle korur. Araştırma ve ticari olmayan kullanım için CC BY-NC-SA 4.0 lisansı altında yayınlanan model, moda teknolojisi girişimleri, e-ticaret platformları ve yaratıcı ajanslar tarafından yaygın olarak benimsenmiştir. Uygulamalar arasında çevrimiçi alışveriş sanal deneme deneyimleri, moda tasarımı prototipleme ve fiziksel çekimsiz katalog üretimi yer alır.