MIT bilim insanları, en popüler yapay zeka görüntü oluşturucularını 30 kat daha hızlı hale getirmenin yolunu buldu

Create a digital drawing in the lighthearted, playful, and vividly colored style evocative of early 20th century animation. Illustrate an image that encapsulates the concept of an AI image generator being made 30 times faster by MIT scientists using 'Distribution Matching Distillation' technique. Incorporate a metaphorical representation of a 100-stage process being condensed into one single step. Also include diffusion models being rapidly taught using DMD. The image should also hint at the reduction of image-generation time and computational power. The illustration should be in a 3:2 aspect ratio.

MIT bilim insanları, 100 aşamalı bir süreci tek bir adımda yoğunlaştırarak popüler yapay zeka görüntü oluşturucularını hızlandıran “dağıtım eşleştirme damıtma” (DMD) adlı bir teknik geliştirdi. Bu yöntem, görüntü kalitesini korurken daha küçük ve daha hızlı YZ modelleriyle sonuçlanır. Yeni yaklaşım, hesaplama süresini 30 kat azaltıyor ve üretilen görsel içeriğin kalitesini koruyor veya aşıyor. DALL-E 3 ve Stable Diffusion gibi difüzyon modelleri, DMD kullanılarak yeni YZ modellerine öğretilir. Bu modeller, rastgele görüntüleri gürültü ile kodlayarak ve ardından çok aşamalı bir süreçle gürültüyü temizleyerek görüntüler üretir. DMD’yi yeni bir modele uygulayan bilim insanları, görüntü oluşturma süresini 2,59 saniyeden 90 milisaniyeye düşürerek 28,8 kat daha hızlı hale getirdi. DMD iki bileşenden oluşur: “regresyon kaybı,” görüntüleri benzerliğe göre düzenler ve “dağılım eşleştirme kaybı,” üretilen görüntülerin tuhaflığını en aza indirir. Bu buluş, hesaplama gücünü önemli ölçüde azaltır ve görüntü oluşturma sürecini hızlandırarak hızlı ve verimli içerik oluşturma gerektiren endüstriler için avantajlı hale getirir.

Makalenin tamamı

Bir yanıt yazın