
  • Normo‘minov Akbar Kamol o‘g‘li Muhammad al-xorazmiy nomidagi toshkent axborot texnologiyalari universiteti


Super-resolution, multimodal yondashuv, generativ model, audio va tasvir birikmasi, neyron tarmoq, fusion modul, dekoder, ResNet, CNN


Ushbu maqolada tovush (audio) va tasvir (image) ma'lumotlarini birlashtirish orqali super-resolution (SR) uchun yangi generativ modelni yaratish taklif qilinadi. Mazkur yondashuv multimodal ma’lumotlardan foydalanib, past aniqlikdagi tasvir va tovushlardan yuqori sifatli natijalar olish imkonini beradi. Ushbu model tovush va tasvir xususiyatlarini chuqur neyron tarmoqlar orqali ajratib, birlashtiruvchi modul yordamida yuqori aniqlikdagi tasvirni qayta tiklash imkoniyatini beradi.  Yondashuvning nazariy asosi, texnik tafsilotlari va eksperimental natijalari muhokama qilinadi.


