تحقيق در زمينه تشخيص چهره فرصتهاي مطالعاتي را فراهم ميآورد که دانشمندان و مهندسان را براي چند سال آينده به چالش خواهد کشيد. به عنوان نمونه، ايجاد يک سيستم تشخيص چهره قدرتمند ميتواند در پروژههاي مرتبط با امنيت ملي، تعامل انسان و کامپيوتر و بسياري از موارد ديگر به کار برده شود. اين مطلب يكي از مقالات بخش ويژه نشريه ماهنامه شبكه در شماره 116 با عنوان امنيت بيومتريك ميباشد. جهت دريافت اين بخش ويژه به بخش پروندههاي ويژه سايت مراجعه نمائيد.
آيا کامپيوترها بهتر از انسانها هستند؟
مطالعات اخير نشان داده، کامپيوترها در زمينه تشخيص چهره از روي تصاوير ثابت چهره گرفته شده است از روبهرو و با نورپردازيهاي متفاوت ميتوانند انسان را مغلوب کنند1. اين نتيجه تا چه حد عموميت دارد؟ انسان در زمينه شناختن چهرههاي آشنا بسيار موفقتر است، اما ما در مورد تواناييهايمان در شناخت چهرههاي نا آشنا کمي زيادهروي کردهايم. در عين حال حتي زماني که با تشخيص چهره افراد نا آشنا مواجه باشيم، انسانها قويترين سيستم تشخيص چهره ممکن را در اختيار دارند. سيستم تشخيص چهره انسان بسيار بهتر از نمونههاي کامپيوتري ميتواند با ترکيبات مختلف ژست، نورپردازي، تار شدن و کاهش کيفيت تصوير هماهنگ شود.
در يک ويديو با کيفيت پايين، انسانها به طور ذاتي الگوهاي زماني و بدني را با هم ترکيب ميکنند. کاري که محققان پيشرو فعلي تازه متوجه آن شدهاند. يکي از کارهاي اخير نشان داده که ترکيب انسان و کامپيوتر ميتواند به توليد يک سيستم تشخيص چهره تقريباً کامل منجر شود (مقاله «ترکيب انسان و الگوريتمهاي مقايسه چهره»، نوشته اِي. جي. اُتول و ديگران، مجله IEEE Trans ويژهنامه سيستمها، انسان و سايبرنتيك سال 2007.
شكل 3 - حالتهاي متنوع چهره يك شخص واحد
بررسي جديدترين فناوريها
گام نخست در هر سيستم تشخيص چهره خودکار، کشف صورت در يک تصوير است.
کشف صورت
هنگامي که صورت تشخيص داده شد، بخش استخراج الگو اطلاعاتي را به دست ميدهد که ميتواند به يک سيستم طبقهبندي چهره منتقل شود. با توجه به نوع سيستم طبقهبندي، اين خصوصيات و الگوها ميتوانند شامل مشخصات موضعي مانند بافت و نقاط ثابت يا از اجزاي چهره مانند چشم و بيني و دهان باشند5.
يکي از پرکاربردترين و قويترين الگوريتمهاي تشخيص چهره توسط بلويولا و مايکل جونز6 طراحي شده است. آنها براي تشخيص اشيا، شيوهاي مبتني بر يادگيري ماشيني را معرفيکردند که در آن از طريق ترکيب تعداد زيادي يادگيرنده ضعيف، يک سيستم طبقهبنديکننده قوي آموزش داده ميشود. براي مسئلهاي که تنها نيازمند دو دسته است و با نمونههاي تمريني برچسبدار، يک الگوريتم يادگيري آدابوست (Adaboost يا Adaptive Boosting)، ميتواند تعداد اندکي از مشخصههاي بصري را انتخاب كند تا بيشترين دقت طبقهبندي فراهم شود.شكل 4 نمونهاي از عملکرد الگوريتم معمول کشف چهره و خصوصيت را نشان ميدهد.
شكل 4- نمونهاي از سيستم کشف چهره و استخراج خصوصيات (شكل از هانکيو مون و همکاران؛ مقاله پردازش شكل، مجله IEEE Trans.، ويژهنامه پردازش تصوير شماره نوامبر 2002).
سالهاي نخست
در اواخر دهه هشتاد و اوايل دهه نود ميلادي، استفاده از شيوههاي متعلق به زيرشاخه تشخيص چهره ساکن (Still-Face) نظير تحليل اجزاي اصلي يا PCA (سرنامPrincipal Component Analysis)، تحليل جداکنندههاي خطي يا LDA (سرنام Linear Discriminant Analysis) و روندي ساختارگرا به نام انطباق گراف الاستيک يا EGM (سرنامElastic Graph Matching) به تحقيقات در زمينه تشخيص چهره رونق بخشيد. از آن زمان تحقيقات زيادي در زمينه توسعه و بهبود اين الگوريتمها صورت گرفته است. در آزمون فناوري تشخيص چهره FRET (سرنام Facial Recognition Technology) که در اواخر سال 1996 و اوايل 1997 روي الگوريتمهاي تشخيص چهره انجام شد7، بهترين کارايي مربوط به روشهاي LDA و EGM بود، يعني الگوريتمهايي که از تحليلهاي شبه فضاي احتمالات مشتق شده بودند. مشکلترين آزمون FRET تشخيص چهره فرد براساس تصاويري بود که با فاصله زماني حداقل هجده ماهه گرفتهشدهبودند. جدول1 خلاصه نتايج سري آزمونهاي FRVT (سرنام Face Recognition Vendor Test) را نشان ميدهد که از اوايل سال 2000 توسط انستيتوي ملي استاندارد و فناوري NIST (سرنام National Institute of Standard and Technology) آغاز شده است.
ژست، نورپردازي و حالت چهره
محققان توانستهاند مشکل تشخيص چهره در وضعيتهاي مختلف ژست، نورپردازي و حالتهاي مختلف PIE (سرنام Pose ,Illumination ,Expression) چهره را حل کنند. تلاشهاي قبلي شامل استفاده از روش بسط چهره آيگن [نسخهاي از تصوير چهره که معادلات رياضي Eigenvector و Eigenspace بر آن اعمال شده است] ميشد که در اين روش فضاهاي آيگن متفاوتي ايجاد شده و هريک از اين فضاها اطلاعات متفاوتي از چهره را در زاويههاي ديد مختلف ثبت ميکرد و براي حل مشکل تفاوت ژستها، از ساخت يک مدل سه بعدي و استخراج نماهاي دو بعدي براي هر ژست استفاده ميشد. براي کنترل حالتهاي متفاوت ژست و نورپردازي، محققان مدل سهبعدي قابل تغييري8 را پيشنهاد کردند که در آن ترکيب خطي مجموعهاي از نمونههاي چهره پارامترهاي لازم را براي بافت و فرم چهره فراهم ميکند. اين پارامترها از طريق جفت کردن مدل سهبعدي روي تصوير ورودي تخمين زده ميشوند.
به اين ترتيب، شيوه مبتني بر مدل سهبعدي قابل تغيير توانست در تشخيص تصاوير چهرهاي که از روبهرو گرفته نشده بودند، نرخ تشخيص بالايي را از خود نشان دهد. حالتهاي فرعي زيادي از اين شيوه با درجههاي گوناگون موفقيت عرضه شدهاند. اغلب اين شيوههاي مبتني بر مدل سهبعدي، به محاسبات سنگين نياز دارند و به طور معمول بايد تعداد کمي از مشخصات و الگوها به صورت دستي انتخاب شوند. در کنار توسعه شيوههاي مبتني بر مدل سهبعدي قابل تغيير، روشهايي براي نرمالسازي نورپردازي باعث جلب توجه محققان عرصه بينايي کامپيوتري شد. تلاشهاي اوليه براي کاهش اثر نورپردازي شامل حذف تعداد کمي از نخستين مقادير آيگن مربوط به بسط اجزاي اصلي صورت ميشده که اين کار با استفاده ازسمت و جهت تغيير طيف رنگي به عنوان يک مشخصه يا ساخت يک زير فضاي نمونه با نام مخروط نورپردازي (Illumination Cone) براي ثبت تصوير شيء لامبرتي محدب انجام ميشد. مدلهاي همسازهاي کروي ابعاد پايين(Low-Dimensional Spherical Harmonics Representations) نيز براي تشخيص چهره در شرايط نوري متفاوت مؤثر شناخته شدهاند. همچنين از طريق توسعه روش مبتني بر مدل سهبعدي قابل تغيير، روشهايي پيشنهاد شدهاند که ميتوانند الگويي از چهره را توليد کنند که نسبت به تغييرات نور ثابت باشد. پيشنهاد ديگر عبارت است از استفاده از محاسبه و ساخت يک تصوير خود تقسيمي که از طريق تقسيم تصوير اصلي بر کپي ملايم شده آن (کپي که در آن شدت تيره و روشنها کاهش يافته است) به دست ميآيد و در نتيجه نسبت به تغييرات نورپردازي حساس نخواهد بود. اين روش نوعي الگوريتم استريو فتومتريک عمومي است که امکان تغيير شکلهاي درون گروهي را فراهم ميآورد. در تحقيقات جديدتر، محققان الگوريتم فيلتر اتفاقي (Stochatic) و غيرايستايي را توسعه دادهاند که براي تخمين نقشههاي بازتابي (Albedo) تشخيص چهره غير حساس به نورپردازي استفاده ميشود. شكل 5 نمونه تخمين اين نقشهها و مدلهاي سهبعدي را از يک تصوير واحد نشان ميدهد. اما بيشتر محققان بر اين نکته توافق دارند که اين روشها نسبت به روشهاي زير فضاي آيگن و... در تشخيص چهره با نورپردازيهاي متفاوت، موفقتر عمل ميکنند، اما همه آنها روي مجموعه دادههاي کنترل شده نظير مجموعه B در دانشگاه ييل يا مجموعه PIE جمعآوري شده در دانشگاه کارنگي ملون آزمايش شدهاند. طراحي روشهايي که در برابر تغييرات نورپردازي در محيطهاي کنترل نشده مقاوم و قدرتمند باشند، هنوز مسئلهاي حل نشده به شمار ميرود. تحليل و تشخيص حالتهاي چهره در تحقيقات مربوط به تعامل انسان و کامپيوتر بسيار مورد مطالعه قرار گرفته است9. هويت و حالت چهره ممکن است با سيستمهاي جداگانهاي پردازش شوند. براي تشخيص خودكار حالتهاي چهره روشهاي بسياري موجود است كه اغلب آنها براي حالتهاي کلي و مقياس بالاي چهره مانند شادي، عصبانيت، تعجب و ترس مؤثر هستند3. يکي از زمينههايي که فعاليت تحقيقاتي در آن دنبال ميشود و توسط برنامه تلويزيوني «به من دروغ بگو» (Lie to Me) به فرهنگ عامه مردم هم نفوذ کرده، تحليل و تشخيص حالتهاي مقياس کوچک چهره است.
شكل 5- نمونههاي استخراج نقشههاي بازتابي غير حساس به نورپردازي و مدلهاي سه بعدي از روي تصاويري که از اينترنت دانلود شدهاند. در هر رديف، تصوير سمت چپ از اينترنت دانلود شده است. دو تصوير بعدي مدل سه بعدي بازسازي شده را از دو زاويه ديد مختلف نشان ميدهند. آخرين مجموعه تصاوير از طريق ترکيب تصاوير جديد حاصل از مدل سه بعدي بر اساس ژستهاي مختلف به دست آمدهاند (از مجموعه تصاوير سوما بيسواز و سايرين (Soma Biswas et al) – مقاله هوش ماشيني و تحليل الگو - مجله IEEE Trans. مي2009)
پينوشتها:
1- مقاله «نتايج مقياس بالاي FVRT 2006 و ICE 2006» نوشته پي. جي. فيليپس و ديگران مجله
IEEE Trans ويژهنامه تحليل الگو و هوش ماشيني شماره مارس 2010
منبع:http://www.shabakeh-mag.com ارسال توسط کاربر محترم سايت : hasantaleb