تحقيق در زمينه تشخيص چهره فرصتهاي مطالعاتي را فراهم ميآورد که دانشمندان و مهندسان را براي چند سال آينده به چالش خواهد کشيد. به عنوان نمونه، ايجاد يک سيستم تشخيص چهره قدرتمند ميتواند در پروژههاي مرتبط با امنيت ملي، تعامل انسان و کامپيوتر و بسياري از موارد ديگر به کار برده شود. اين مطلب يكي از مقالات بخش ويژه نشريه ماهنامه شبكه در شماره 116 با عنوان امنيت بيومتريك ميباشد. جهت دريافت اين بخش ويژه به بخش پروندههاي ويژه سايت مراجعه نمائيد.
مدلسازي خصوصيات چهره
مدلسازي مؤثر خصوصيات چهره هر سوژه از روي دادههاي ويديويي، تنها زماني امكانپذير ميشود که تغييرات ظاهر چهره در طول مدت ويديو را بتوان به درستي براساس فاکتورهاي مختلف نظير ژست، نور و حالت چهره دستهبندي كرد. برخلاف سناريوهاي مبتني بر تصوير ثابت، اين تغييرات به طور ذاتي در سيستمهاي VFR وجود دارند و براي بهرهبرداري از اطلاعات افزوده موجود در دادههاي ويديويي بايد آنها را نيز مدنظر قرار داد.
همچنين، با در نظر گرفتن طبيعت دادههاي ورودي، VFR معمولاً با مسئله «ردگيري» مواجه است که خود چالش بزرگي به شمار ميآيد. در بيشتر مواقع دقت ردگيري سيستم به در اختيار داشتن مدل قابل اعتمادي از قيافه و ظاهر بستگي دارد، اما نتايج تشخيص سيستم معمولاً به دقت تعيين محل چهره در ويديوي ورودي بستگي دارد. محققان، سيستمهاي VFR موجود را براساس متد ترکيبي ردگيري و تشخيص طراحي کردهاند. اين متد عبارت است از ترکيب يک الگوريتم تطابق گراف خصوصيات چهره در طول محور زمان با يک روش مبتني بر مدل سه بعدي يا مدلهاي پنهان ماکاروف يا نمودار احتمالات تنوع ظاهري. جدول 2 خلاصهاي از روشهاي موجود را نشان ميدهد.
جهت دهي تحقيقات آينده
اگرچه حجم عظيمي از سابقههاي آزمايش و پژوهش در زمينه درک چهره توسط انسان وجود دارد، اما بسياري از موارد اساسي هنوز حل نشده باقي ماندهاند.
اطلاعات مربوط به پيکربندي
نخست ما بايد دقيقاً تعيين کنيم که چه اطلاعاتي در رابطه با پيکره (شکل کلي) چهره براي تشخيص آن مهم است. در بيشتر تحقيقات سعي شده با تمرکز بر تفاوت بين روشهاي تشخيص چهره مبتني بر خصوصيات چهره و روشهاي مبتني بر پيکره چهره از اين مسئله صرف نظر شود. به طور مشخص در اين ميان چيزي از کليت چهره (Face Gestalt) اهميت فوقالعادهاي دارد، اما ما هنوز دقيقاً نميدانيم که چگونه اين مفهوم کلي را جمعبندي و مشخص کنيم. کدام يک از ابعاد و خصوصيات چهره ميتواند در اين سيستم نشانهگذاري به ما کمک کند؟
نقش آشنا بودن چهره
در وحله بعدي ما بايد به اين نتيجه برسيم که چگونه آشنا بودن چهره بر نحوه درک و تصور ما از چهره تأثير ميگذارد. فرآيند تشخيص چهره در انسان، ميتواند با کاهش دقت تصوير افراد آشنا، بسيار بهتر از افرادي که فقط با آنها آشنايي مختصري داريم، کنار بيايد. اين امر ما را به اين نتيجه ميرساند که تصور دروني (ذهني) ما از چهره افراد با افزايش ميزان آشنايي، تغييرات زيادي را متحمل خواهد شد و در نتيجه سؤالات متعددي را پيش روي ما قرار خواهد داد. ماهيت اين تغييرات چيست؟ آيا تغيير فرآيند کدگذاري از حالت مبتني بر جزئيات به حالت کل گرا نتايج بهتري را فراهم خواهد آورد؟ چگونه ميتوان از اين تغييرات براي افزايش قدرت و قابليت سيستم در برابر تغيير شکلها بهره برد؟
انتظارات از بالا به پايين
[در روش طراحي يا پردازش بالا به پايين، ابتدا شماي کلي طرح يا محصول ايجاد يا شناخته ميشود، سپس مراحل بعدي بدون جزئيات توصيف شده و هرکدام جداگانه پردازش ميشود. اين روند تا رسيدن به جزئيات لازم ادامه مييابد. در روش پايين به بالا، از ابتدا تمام زيرسيستمهاي اوليه با جزئيات کافي طراحي و ساخته شده و از اتصال آنها به يکديگر سيستم سطح بالاتر ساخته مي شود و اين روند تا رسيدن به سيستم پيچيده نهايي ادامه مييابد].
سوم ما بايد تصميم بگيريم که انتظارات مدل بالا به پايين چه نقشي در سيستم تشخيص بازي خواهد کرد. به خاطر داشته باشيد که زمان تأخير نورونهاي انتخابي در تشخيص چهره انساني، در ناحيه اينفروتمپورال کورتکس (Infero-Temporal Cortex) بيش از صد ميلي ثانيه بود. با درنظر گرفتن ايدههاي معمول کدگذاري تناوبي [Rate Codingکه فرآيندي مربوط به واکنش نورونها در برابر محرکهاي تکراري است] اين تأخير پايين ما را به اين فکر مياندازد که شايد، فرآيند پردازش چهره ذاتاً بايد به شدت مبتني بر سيستم بازخورد به جلو (Feed Forward) باشد. در چنين صورتي، انتظارات و توقعات قبلي چگونه ميتواند بر محاسبه هويت تأثير بگذارد؟ همچنين، تحت چه شرايطي تأثيرات روش بالا به پايين ميتواند به سيستمهاي تشخيص چهره معمول کمک کند؟ پاسخ به اين سؤالات نه تنها نويد آشکارکردن فرآيند تشخيص چهره در مغز را با خود به همراه دارد، بلکه نشانهها و راهنماييهايي را براي توسعه راهبردهاي مؤثرتر و ارائههايي مناسب کاربرد در سيستمهاي مبتني بر بينايي کامپيوتري را نيز فراهم خواهد کرد.
تشخيص چهره از راه دور
اغلب سيستمها و الگوريتمهاي تشخيص چهره موجود، تنها زماني کارا هستند که سوژه در فاصله چندين ده متري دوربين قرار گرفته باشد. افزايش فاصله مؤثر در سيستمهاي تشخيص چهره، دغدغه و نيروي محرکه جديدي در کاربردهاي نظارتي است. در سناريوهاي تشخيص چهره از دور، تصاوير چهره اغلب مات و محو خواهند بود، ممکن است تعداد پيکسلهاي کافي در محدوده چهره موجود نباشد و همچنين ممکن است تنوع نورپردازي و ژستهاي فراواني داشته باشند يا در برابر اين تصاوير موانعي وجود داشته باشد. در سناريوهاي تشخيص چهره از دور، ثبت نشانههاي صورت با کيفيت مناسب و کافي جهت انتقال به موتور تشخيص چهره خود چالشي بزرگمحسوبميشود. اين مشکل به خصوص زماني که حسگر و سوژه متحرک باشند، شديدتر خودنمايي ميکند. در چنين حالتي ابتدا بايد ويديو را تثبيت و استوار کرد تا بتوان چهره را پيش از تشخيص ردگيري کرد.
تشخيص چهره مبتني بر ويديو
بخش امنيت نيروي دريايي و ساير کاربردهاي امنيتي، به راهکارهاي قابل اعتمادي نياز دارند که بتوانند تواليهاي ويديويي را استخراج کنند. تشخيص چهره مبتني بر ويديو، در طي نه سال اخير توجه زيادي را به خود جلب کرده است. در مراحل اوليه توسعه، تحقيقات در زمينه VFR بايد با کمبود دادههاي ويديويي دست و پنجه نرم ميکرد. در برنامه مسابقات بزرگ بيومتريک چندگانه که توسط مؤسسه استاندارد و فناوري امريکا (NIST) برگزار شد(http://face.nist.gov/mbgc)، نزديك به 4489 سکانس ويديويي براي توسعه و ارزيابي و امتيازبندي روشهاي تطابق ويديو به ويديو در اختيار شرکت کنندگان قرار گرفت. براي هرچه مؤثرترشدن چنين اقداماتي، اين مشکلات بايد حل شوند: ردگيري و نرمالسازي ژست چهرههاي متحرک به صورت بيدرنگ، نرمالسازي نورپردازي، جبران کيفيت پايين تصاوير چهره با تکيه بر تکنيکهاي افزايش کيفيت و ردگيري و تشخيص همزمان. همچنين الگوريتمهاي داراي قابليت سازگاري با تصاوير چندين گالري و سکانسهاي کاوش ويديويي بايد توسعه داده شوند.
تشخيص چهره در شبکه دوربينها
شبکههاي چنددوربيني به راهحلهايي بسيار معمول براي کاربردهاي نظارتي مقياس وسيع تبديل شدهاند. در اختيار داشتن شبکهاي از دوربينها که بتواند تصاوير متعددي از چهره افراد تهيه کند، به توسعهدهندگان کمک خواهد کرد تا با روشهاي قدرتمندتري به توصيف چهره بپردازند. چنين وضعيتي اين احتمال را كه تصوير فردي با ژستي از روبهرو يا تقريباً از روبهرو ثبت شود، نيز افزايش خواهد داد. اما براي استفاده از اطلاعات اين ديدهاي مختلف، بايد بتوانيم وضعيت سر فرد را برآورد کنيم. اين کار ميتواند به صورت صريح و از طريق محاسبه و تبديل ژست واقعي فرد به يک حالت تخميني قابل قبول انجام شود يا به صورت ضمني و از طريق يک الگوريتم انتخاب ديد انجام پذيرد. اما تعيين وضعيت دقيق سر سوژه به خصوص زماني که کيفيت تصاوير پايين باشد يا کاليبراسيون هر دو دوربين داخلي و خارجي از دقت کافي جهت ترکيب مناسب چند ديد مختلف برخوردار نباشد، بسيار مشکل خواهد بود. اين مشکل زماني که سوژه در فاصله دوري از دوربينها قرار دارد نيز وجود خواهد داشت. همچنين مشکلات ديگري نظير ردگيري در چند ديد مختلف، ارائه و تفسير مناسب از تصاوير چهره چند ديدي و تشخيص چهره چند ديدي هم در انتظار راه حل به سر ميبرند. و در نهايت اين موضوع كه آيا الگوريتمهاي مورد نياز بايد متمرکز يا توزيعشده باشند، خود مسئله حياتي ديگري است.
منبع:http://www.shabakeh-mag.com ارسال توسط کاربر محترم سايت : hasantaleb