هرچه را که بنويسي مي فهمم

از تايپ کردن خسته شده ايد؟ نمي توانيد مدت زمان زيادي را به نوشتن و دوباره تايپ کردن يک متن طولاني دانشگاهي يا گزارش خبري تان اختصاص دهيد؟ آيا مي خواهيد صفحات يک کتاب را اسکن کنيد تا بتوانيد قسمت هاي مورد نيازش را حذف و برخي قسمت هاي ديگر را براي ويرايش و تغيير انتخاب کنيد اما وقت نداريد؟ نامه اي طولاني نوشته ايد اما آنقدر بدخط است که فقط خودتان مي توانيد بخوانيدش و مجبوريد دوباره تايپ کنيد؟ پيشنهاد ما اين است که از فناوري نوين و جالب OCR استفاده کنيد.
فناوري تشخيص يا ادراک نوري حروف که از آن به عنوان Optical Character Recognition يا اختصاراً OCR نام مي برند، يکي از انواع نرم افزارهاي کامپيوتري است که براي ترجمه تصاوير حاوي دست نوشته ها و يا تايپ نوشته هاي غالباً ثبت شده توسط اسکنر، به متن و حروف قابل درک و فهم براي کامپيوتر استفاده مي شود.
اين فناوري از تشخيص قالب و الگو، هوش مصنوعي و چشم ماشيني استفاده مي کند تا متن هايي را که به صورت پرينت شده يا دست نوشته بر روي کاغذهاي معمولي در اختيار داريم به متن هاي قابل ويرايش توسط نرم افزارهاي اديتور متن با کامپيوتر بدل کند.
معمولاً از OCR در مواقعي استفاده مي شود که فرصت زيادي براي تايپ کردن متون وجود ندارد و شما مي خواهيد به سرعت متني را که به شکل دست نوشته با قلم يا خودکارهاي معمولي روي کاغذ نوشته ايد، اسکن کنيد تا بتوانيد آن را به شکل هاي مختلف، ويرايش متني کنيد.
يکي ديگر از کاربردهاي فناوري تشخيص بصري حروف در زماني است که شما مي خواهيد متن مقالات، کتاب ها يا نوشته هاي از قبل پرينت شده اي را اسکن و مجدداً ويرايش و ارسال کنيد که حجم زيادي دارند و ذخيره سازي آنها در قالب فايل هاي تصويري مثل JPEG يا GIF امکانپذير نيست.
نرم افزارهاي جديد OCR که غالباً از آنها در گوشي هاي تلفن همراه يا کامپيوترهاي قابل حمل مجهز به صفحه هاي لمسي و Pad هاي نوشتار با قلم نوري استفاده مي شود، امکاني براي تمرين کردن دارند، به اين معني که هر کاربر جديد، در مدت زماني خاص متوني مشخص شده را با دست خط خود مي نويسد و از طريق اسکنر يا Touch Pad به نرم افزار ارسال مي کند تا سنسورهاي مصنوعي و نرم افزاري بصري، با اين دستخط آشنا شوند و بتوانند همواره آن را درک کنند.
مطمئنا ماشين يا کامپيوتر به عنوان يک دستگاه صرف، داراي هوش و ادراک انساني نيست و نمي تواند متن هايي را که به صورت دست خط به او داده مي شود درک کند؛ ضمن اينکه کامپيوتر، تمامي تصاوير ذخيره شده با فرمت هاي تصويري مثل Gif را تنها به عنوان يک تصوير مي شناسد و هيچ گاه محتويات آن را براي ويرايش درک نمي کند. به همين رو نياز است تا در صورتي که از آن براي تشخيص دستخط انساني استفاده مي شود، به مدتي خاص تحت تمرين قرار بگيرد.
نمونه اين تمرين براي افزايش هوش مصنوعي کامپيوتر را در مجموعه ارايه شده Office2003 مي توانيم بيابيم، جايي که در نرم افزارهايي مثل Word شما مي توانيد فرمانهاي صوتي را براي اجراي دستورها و توابع مختلف به نرم افزار بدهيد. براي اين کار و افزايش بازدهي عملگر فرمان صوتي که بتواند دقيق تر و با درصد خطاي کمتري کلام شما را متوجه شود، بخشي با عنوان Speech Training وجود دارد که در آن شما متن هاي مشخصي را با صداي خودتان براي نرم افزار مي خوانيد و حافظه مجازي نرم افزار نيز فرکانس ها و بسامد هاي صداي شما را ذخيره مي کند و هر لغت جديدي را که شما ادا کنيد، بدون مشکل تشخيص مي دهد.
با اين تفاسير مي توانيم به طور خلاصه اين گونه جمع بندي کنيم که OCR براي تبديل تصاوير محو و مبهم به متن هاي قابل درک و ويرايش مورد استفاده قرار مي گيرد و اشکال گرافيکي را به کدهاي ASCII و Unicode تبديل مي کند، به شکلي که فونت ، اندازه ، استيل ، صفحه آرايي و تمام مختصات پاراگرافي آنها قابل ويرايش باشد.

? تاريخچه

در سال 1929 براي نخستين بار، گوستاو توشچک از آلمان، امتيازي براي اختراع خود با نام OCR دريافت کرد و از همان زمان، کار طراحي نرم افزارهاي هوشمند درک متن را آغاز کرد.
اختراع او، يک دستگاه اسکنر نوري بود که يک سري الگوهاي متني آماده را در خود ذخيره مي کرد و متن هايي که دريافت مي کرد در صورت تطابق کامل و تشابه، بدون کم و کاست با الگوي ابتدايي ذخيره شده، درک مي کرد و به کامپيوتر مي داد.
ايراد اختراع او اين بود که يک نمونه از پيش تهيه شده شامل شکل کوچک و بزرگ حروف الفبا در اختيار داشت و در صورتي که متن ارايه شده به دستگاه، کوچک ترين تفاوتي با الگو و نمونه آماده داشت، قادر به تشخيص نبود. با اين حال، اين کار سرآغاز ارايه اختراعاتي شد که بعدها به توليد نرم افزارهاي هوشمند تشخيص متن انجاميد. در حال حاضر، اين نرم افزارها براي درک متون تصويري به زبان هاي مختلف طراحي شده اند و نمونه هاي جديد آنها بر روي بسياري از گوشي هاي تلفن همراه نصب شده است.
اساس و پايه کار قلم هاي نوري يا Light penهايي که همراه با برخي گوشي هاي تلفن همراه ارايه مي شوند نيز همين فناوري است. زماني که شما براي تايپ کردن متن يک پيام کوتاه يا شماره گيري کردن، بدون در اختيار داشتن هيچ کيبوردي، تنها به نوشتن معمولي اعداد و حروف با دستخط خاص خودتان مبادرت مي کنيد، يعني در حال استفاده از ثمرات OCR هستيد، آن هم به شکلي که يک صفحه کريستال مايع هوشمند به کمک قلم نوري، امکان درک و رديابي خطوط به ظاهر بي معني و ترسيم شده توسط شما را فراهم مي کند.
در سال 1950 دومين نمونه نرم افزار تشخيص خط بصري کاراکترها توسط ديويد شپارد از سرويس جاسوسي سازمان نيروهاي مسلح ايالات متحده طراحي شد. شپارد که متخصص رمزشکني و باز کردن قفل هاي مخفي اطلاعاتي و متني بود، با همکاري يک پروفسور ژاپني، نمونه اي از نرم افزار نوين OCR را طر احي کرد که نيازي به الگوي ثابت از پيش تعيين شده نداشت و به راحتي مي توانست دست خط هاي افراد مختلف را درک کند.
ويژگي اين نرم افزار، فهميدن و درک راحت متن هايي بود که بسيار کم رنگ و يا توسط مداد نوشته شده بودند و يا بر اثر گذشت زمان، از وضوحشان کاسته شده بود. در آن زمان، به دليل وجود نداشتن نرم افزارهايي مثل Adobe Photoshop که بتوانند وضوح و contrast تصاوير را تنظيم کنند، بالا بردن کيفيت و ترميم تصاوير قديمي، تار و محوشده بسيار سخت بود و به آساني انجام نمي گرفت.
همچنين سرويس پستي ايالات متحده، از سال 1956 شروع به استفاده از OCR کرده تا بتواند امور مربوط به ارسال و دريافت نامه هاي خود در سراسر دنيا را ساماندهي کند. با استفاده از فناوري تشخيص بصري متن، ادارات پست سراسر آمريکا به جاي وارد کردن دستي يا تايپ اطلاعات مربوط به هر نامه، پاکت ها و بسته هاي پستي را اسکن مي کنند و اطلاعات مورد نياز نيز به شکل خودکار توسط کامپيوتر فهميده و ذخيره مي شود. ياکوب رينبو، نخستين کسي بود که اين سيستم را وارد ادارات پست و بانک هاي آمريکايي کرد.
در حال حاضر هرچند نرم افزار رسمي و معتبري براي درک متون به زبان هاي آسياي غربي و برخي زبان هاي غيرلاتين ديگر وجود ندارد، اما جديدترين حوزه تحقيق و گسترش نرم افزارهاي OCR براي تشخيص حروف چسبان و شکسته لاتين به کار گرفته مي شود.
در حال حاضر براي اکثر زبان هايي مانند فرانسوي، ايتاليايي، انگليسي و آلماني که از الفباي لاتين استفاده مي کنند، نرم افزار تشخيص بصري کاراکترها وجود دارد و اشکالات رايج در آنها به دليل وجود تفاوت در املاي برخي از کلمات يا تفاوت الفبا نيز حل شده است.
به همين دليل کارشناسان، به اين حوزه روي آورده اند که نرم افزارها را قادر سازند حروف چسبان، شکسته و خوشنويسي را درک کنند.
گفته مي شود برخي از شرکت هاي نرم افزاري در کشور ما نيز مشغول طراحي نرم افزار OCR فارسي هستند با اين حال به نظر مي رسد به دليل پيچيدگي هاي خاص موجود در نوشتار و الفباي فارسي و تعدد سبک هاي نوشتاري فارسي براي اشخاص مختلف که حروف گوناگون را به اشکال متنوع تحرير مي کنند، اين کار تا مدت هاي زياد نياز به تحقيق و مطالعه داشته باشد.
منبع:روزنامه فناوران
/ن