بهبود پاسخ دقيق در مورد اقدامات انساني در سيستم پرسش و پاسخ تصويري
کلمات کلیدی:
پردازش تصوير, شناسايي فعاليت انسان, يادگيري عميق, شبکه عصبي کانولوشني, سيستم پرسش ديداري پاسخ, حافظه بلند مدتچکیده
تشخيص فعاليت يك ابزار ضروري است كه تحليلي كارآمد روي رفتار انسان و نيز تعاملات كارآمد بين انسانها و سيستمهاي بينايي را ممكن ميسازد. درعينحال شناخت عمل انساني به دليل تغييرات قابل توجه در اقدامات انساني، از لحاظ سبكهاي شخصي، ظاهر انسان، ديدگاه دوربين، پسزمينه متغير و ديگر تغييرات محيطي يك وظيفه بسيار چالشبرانگيز است، اما تاکنون يک مدل موثر و کارآمد که بتواند با محاسبات کم مراحل تشخيص و درک تصوير را آشكار کند، ارائه نشدهاست. اين حوزه از تحقيق به دليل كاربرد در حوزههاي مختلف اعم از پزشكي، تعامل انسان-رايانه، تجاري و...، نظر بسياري از محققان را به سمت خود جلب كردهاست. براي اين منظور، ما با هدف بهبود دقت پاسخ در سيستم پرسش و پاسخ تصويري[1] و افزايش ميزان دقت در تشخيص فعاليت انسان، راهکار استفاده از مکانيسم يادگيري عميق به جهت تشخيص اطلاعات تصاوير و سيستم پرسش و پاسخ تصويري به جهت پيشبيني پاسخ از سوالات موجود در تصاوير را پيشنهاد ميکنيم. روش پيشنهادي ما چارچوب شناسايي حلقهها را مقياس گذاري، استقرار و نظارت ميکند. در نهايت پاسخ به سوال با توجه به وزنهاي محاسبه شده در مرحله آموزش، ويژگيهاي تصوير ورودي و مبناي درستي محاسبه ميشود و نهايتا با توجه به خوشهبندي پيشنهادي موجب بهبود در پاسخ دقيق ميشود. روش پيشنهادي در دقت و سرعت اجراي الگوريتم نسبت به ساير روشها برتري دارد.