Google memamerkan Lumiere, model difusi ruang-waktu untuk video AI yang realistis

Illustrate an image in the 3:2 aspect ratio depicting the concept of Lumiere, a high-tech algorithm transforming still images into dynamic and realistic videos. Show a user uploading a picture into an Abstract futuristic device, and then portray the device transforming this picture into a vibrant and breath-taking video. The device should emanate beams of glowing light, symbolizing the diffusion process over time. The user can be an Asian male tech enthusiast, engrossed and fascinated by the process. The color palette should be positive and light, reflecting an optimistic outlook towards this revolutionary technology.

Lumiere adalah model difusi video yang diusulkan oleh para peneliti dari Google, Weizmann Institute of Science, dan Tel Aviv University. Model ini bertujuan untuk menghasilkan video yang realistis dan bergaya dengan kemampuan untuk mengeditnya. Pengguna dapat memberikan input teks atau mengunggah gambar diam untuk diubah menjadi video yang dinamis. Model ini juga mendukung fitur-fitur seperti inpainting, cinemagraphs, dan generasi bergaya. Lumiere mengambil pendekatan yang berbeda dari model yang sudah ada dengan menghasilkan seluruh durasi temporal video sekaligus, sehingga menghasilkan gerakan yang lebih realistis dan koheren. Lumiere dilatih pada kumpulan data 30 juta video dan mampu menghasilkan 80 frame pada 16 fps. Dibandingkan dengan model video AI lainnya, Lumiere menghasilkan video 5 detik dengan besaran gerakan yang lebih tinggi, konsistensi temporal, dan kualitas keseluruhan. Namun demikian, Lumiere memiliki keterbatasan dan tidak dapat menghasilkan video dengan beberapa bidikan atau transisi adegan. Lumiere belum tersedia untuk pengujian, tetapi menunjukkan harapan di pasar video AI yang berkembang pesat.

Artikel lengkap

Tinggalkan Balasan