17 اردیبهشت 1403
وحيد قاسمي

وحید قاسمی

مرتبه علمی: استادیار
نشانی: -
تحصیلات: دکترای تخصصی / مهندسی کامپیوتر
تلفن: 08338305001-(1108 داخلی )
دانشکده: دانشکده فناوری اطلاعات

مشخصات پژوهش

عنوان
تقسیم بندی تصویر در فشرده ساز VVC با بهره گیری از شبکه های عصبی عمیق برای سیستم های منابع محدود
نوع پژوهش پایان نامه
کلیدواژه‌ها
فشرده سازی – VVC – پارتیشن بندی- شبکه عصبی
پژوهشگران فاطمه ملکی ()، مریم محبی (دانشجو)، محمد دهنوی (استاد راهنمای اول)، وحید قاسمی (استاد راهنمای دوم)

چکیده

از دیرباز فشرده سازی ویدئو جهت انتقال آن مورد توجه دانشمندان حوزه پردازش تصویر بوده است و همواره تلاش آنها کاهش میزان اطلاعات ارسالی برای یک ویدئو با حفظ کیفیت بوده است. در این راستا استاندار های متعددی در طول سالهای اخیر جهت فشرده سازی ویدئو ارائه شده است. با این حال، VVC آخرین استاندارد فشرده سازی و رمزگشایی ویدیو است در مقایسه با استاندارد قبلی، HEVC اضافه شده است. با این حال، با افزایش وضوح تصویر و ویدئو، نیاز به تعریف مجدد اندازه و مفهوم واحد فشرده ساز اولیه وجود داشت. به همین دلیل، یک ساختار داده درختی128×128 در استانداردVVC پیشنهاد شده است که به آن درخت کدگذاری (QTMT) گفته می شود .در نتیجه، میزان فشرده سازی با حفظ کیفیت ثابت به طور قابل توجهی بهبود می یابد، اما حجم محاسبات به شدت افزایش می یابد. به منظور حل این مشکل ، الگوریتم هایی پیشنهاد شده اند که با حفظ بازده فشرده سازی در حد امکان، حجم محاسباتی را کاهش می دهند. برخی الگوریتم ها در صورت برآورده شدن یک شرط خاص، که در فرآیند فشرده سازی مشخص است، جستجو برای CU های پایین تر را متوقف می کنند. اگرچه این روش ها سرعت فشرده سازی را بهبود می بخشند، اما راندمان فشرده سازی بالایی را تضمین نمی کنند و همچنان پیچیدگی هایی دارند. یکی از روش سریع تصمیم گیری عمق CU استفاده از شبکه های عصبی است. ابتدا، پایگاه های داده برای آموزش و آزمایش شبکه های عصبی در مورد تقسیم CU در هر عمق ساخته می شوند. پایگاه داده ها شامل داده های تصویری و برداری است که شامل اطلاعات فشرده سازی و برچسبی است که نشان می دهد آیا باید CU تقسیم شود. پایگاه های داده برای CU با عمق های 128×128، 64×64، 32×32 ، 16×16، 32×16، 32×8، 32×24، 8×16، 4 ×16، 16×16، 4×8 و 8×8 ساخته شده اند. همچنین یک معماری شبکه عصبی برای آموزش با پایگاه های داده طراحی می شود ، که تقسیم و عدم تقسیم را در هر عمق مشخص می کند. با استفاده از داده های تصویر می توان CU را بدون توجه به تقسیم بندی بر اساس تصویر اصلی آموزش داد. علاوه بر این، اثرات اطلاعات فشرده سازی CU بر تقسیم CU را می توان با استفاده از داده های برداری در آموزش در نظر گرفت. در حالت کلی، فرایند فشرده سازی یک فرایند پیچیده با حجم محاسباتی بالاست به گونه ای که دستیابی به یک سیستم بلادرنگ امری دشوار است. یکی از روش های دستیابی به