اين مقاله سعي دارد تا با اشاره به موارد مختلفي که مي¬تواند در جستجو و بازيابي اطلاعات سرعت و دقت و جامعيت و مانعيت جستجو را بالاببرد موجب افزايش مهارت کاربران اينترنت فارسي بشود. اينترنت به عنوان يک محمل اطلاعاتي عظيم، منابع اطلاعاتي را در مقياسي وسيع در دسترس مخاطبان بالقوه قرار داده است. اغلب سهولت دسترسي به منابع اطلاعاتي اعم از متن و ساير رسانه ها عمده ترين مزيت اينترنت محسوب مي شود. اما اين توانايي که هرکس ناشر آثار خود باشد عواقب ناخواسته اي را نيز در پي خواهد داشت و آشکارترين معضل، آن است که انبوهي از منابع بسيار متنوع و غير قابل مديريت را فراهم مي¬آورد. افزايش سريع منابع اينترنتي نيازمند يک سازمان¬دهي مفيد و موثر است.
هرچند در حال حاضر راهنماهايي براي منابع اينترنتي تهيه شده است که براساس فايل هاي مقلوب ساخته شدهِ توسط موتورهاي جستجو و با استفاده از قابليت هاي مختلف اين موتورها از جمله : استفاده از عملگرهاي بولي، جستجوي دقيق عبارت، محدود کردن يک جستجو به بخش خاصي از رکورد (مانند عنوان ، آدرس) ، کوتاه سازي کلمات، جستجوي نزديک يابي واژه ها، ايجاد محدوديت زماني و منطقه اي و زباني، و .... به جستجوي اطلاعات کمک مي¬کند، اما بايد تاکيد کرد که در امر بازيابي اطلاعات از اينترنت بدون نمايه سازي نظام يافته نمي توان انتظار بازيابي مفيد و موثر را داشت. هرچند بيش تر اطلاعات موجود بر روي اينترنت به زبان انگليسي است، ولي حجم اطلاعات به زبان فارسي نيز با سرعت در حال افزايش است و کاربران به دلايل مختلفي علاقه زيادي به اطلاعات فارسي نشان مي¬دهند و از آنجايي¬که زبان غالب در اينترنت انگليسي است جستجو به زبان هاي غير انگليسي از جمله فارسي، مسايل و مشکلات مختلفي را جداي از مشکلات عمومي اينترنت دارد.
خط فارسي
اشکال و نقصي که در همه خطوط جهان است دو علت دارد که يکي در اصل خط است و ديگري بر اثر تغيير و تحول زبان ايجاد مي شود. دقت فراوان در ثبت همه دقايق تلفظ اغلب موجب دشواري شيوه خط است و اين دقت زماني ضرورت مي يابد که زباني توسعه بسيار بيابد و در کشورهاي ديگري که به آن زبان سخن نمي گويند رايج شود. به عنوان مثال در خط عربي نقطه و علامت هاي حرکات وقتي به وجود آمد که زبان عربي نزد ملت هاي غير عرب معمول شد، در خط يوناني نيز نشانه هاي آهنگ و تکيه[3] پس از رواج آن زبان در مصر ايجاد شد تا کساني که زبان مادري شان يوناني نبود و با تلفظ آن مانوس نبودند بتوانند کلمات و عبارات يوناني را هر چه درست تر ادا کنند. با اين حال هيچ خطي هر قدر دقيق و شماره علامات آن فراوان باشد، ممکن نيست که کاملاً نشانه شيوه تلفظ باشد. و با کمک علامات متعدد علم حروف نيز تا کسي چگونگي تلفظ زباني را نشنود نمي تواند عبارت و کلمات آنرا مانند اهل آن زبان ادا کند. اما نقصي که بر اثر تحول زبان و به تدريج در خط حاصل مي شود، مشکلي است که همه ملت ها با آن رو به رو هستند. بعضي از حروف و اصوات زبان در طي زمان تغيير مي پذيرند و اين تغيير در گفتار حاصل مي شود، اما خط هميشه صورت کهن تلفظ را حفظ مي کند، و از اينجا ميان "گفتار" و "نوشتار" اختلاف روي مي دهد. ديگر آن که هر زباني ناگزير لغاتي از زبان هاي ديگر به عاريت مي گيرد و اگر علايم خط در اين دو زبان يکي باشد کلمه خارجي به همان املاي اصلي در نوشتن به کار مي رودکه اغلب با املاي کلمه مشابه در زبان ثانوي تفاوت دارد و از اينجا براي اصوات واحد علايم خطي متعدد پديد مي آيد. در خط فارسي نمونه همه اين موارد را مي توان يافت. چون خط عربي براي نوشتن فارسي به کار رفت کلماتي که از آن زبان اخذ شده بود به همان صورت اصلي نوشته شد. حال آنکه به يقين در هيچ دوره اي حروف خاص عربي را فارسي زبان ها درست مثل اصل تلفظ نکرده اند. در زبان هاي ديگر نيز اين گونه موارد نمونه هاي متعدد دارد. شايد دو زبان انگليسي و فرانسه بيش از همه زبان هاي جهان دچار اختلاف تلفظ و خط باشند. به طور کلي نقايص و معايبي که در خطوط معمول جهان است را مي توان به طريق زير طبقه بندي کرد:
1. شکل واحدي اصوات مختلف را بيان مي کند. چنانکه در فارسي حرف "ي" را گاهي براي حرف لين بکار مي-بريم (يک) و گاهي براي حرف مد (بي) و گاهي به جاي الف (عيسي) و گاهي براي نشان دادن مصوت مرکب (ري). و يا حرف «و» در کلمات (سوار، سود، تو)
2. اصوات واحد به صورت هاي مختلف نوشته مي شود. در فارسي حرف "س" سه صورت (س – ص – ث) و حرف "ز" چهار صورت (ز – ذ- ض- ظ) دارد؛ در زبان فرانسه حروفي که "سن" خوانده مي شود پنج رسم الخط دارد که اگر صورت هاي جمع را نيز به حساب بياوريم ده شکل مي شود از اين قرار (saint, ceint, sein, seing, sain)
3. بسياري از حروف نوشته مي شود ولي خوانده نمي شود. يعني علاماتي بي فايده در نوشتن به کار مي رود در فارسي نوشتن "واو معدوله" و "هاء غير ملفوظ" از اين قبيل است. در انگليسي نمونه اين مورد بسيار است مانند high که دو حرف آخر آن به کلي از تلفظ ساقط است. و يا “K” در کلمه “Know” .
4. اصواتي هستند که تلفظ مي شود اما در خط نشانه اي براي آن ها نيست. در فارسي سه مصوت کوتاه ( ِ ) از اين قبيل است هم چنين الف در کلمات اسحق و الله که در کتابت نمي آيد. [4]زبان و خط فارسي نيز مشکلات خاصي را دارا مي¬باشد و نظام نوشتاري فارسي براي ثبت دقيق گفتار، نارسايي دارد و قواعد نگارش آن مدون نيست، از اين رو فاصله ميان گفتار و نوشتار در فارسي قابل توجه است. بيش ترين مشکلات نيز به جهت نبود يک رسم الخط واحد که عموم اساتيد و اهل فن روي آن اجماع کرده باشند به وجود آمده است. به طوري که در حال حاضر جداي از چندين شيوه نامه رسمي همچون" شيوه نامه سمت، نشر دانشگاهي، فرهنگستان، آموزش و پرورش" به تعداد افراد جامعه، رسم الخط و شيوه نگارش زبان وجود دارد، هر ناشري براي خود به قاعده اي دلخواه عمل مي کندکه اين تعددها موجب پريشاني و پراکندگي شده و با يک¬ديگر تفاوت هايي دارند. از ديگر دلايل مي توان به عاريتي بودن خط فارسي و چاره انديشي براي حرکات و عدم تطابق واج ها با حروف اشاره کرد. متصل و منفصل نويسي نيز يکي ديگر از حوزه هاي مورد اختلاف است از ديگر مشکلات: گوناگوني معادل هاي علمي، انواع مختلف ضبط اسامي خارجي، سرهم نويسي، جدانويسي، بي فاصله نويسي، انواع جمع ها، صورت هاي مختلف نوشتاري، آوانويسي اسامي عناصر و ترکيبات شيميايي، سرواژه ها و کوته نوشت ها مي¬باشد. به طور کلي نقص هايي که براي زبان فارسي شمرده اند به شرح زير مي توان عنوان کرد:
1.سه مصوت کوتاه يعني حرکات زير و زبر و پيش ( ِ ) را از نوشتن ساقط مي¬کنيم. و اين باعث مي شود به جاي اين که از خط و نوشتار پي به معني ببريم بايستي از معني کلمه و جايگاه آن در جمله آن¬را درست بخوانيم مانند کلمات (کرم، کرم، کِرِم، کر م، کِرم) و (ملک، ملِک، ملک، مِلک) و يا سه کلمه (حکم، حکم، حِکم) و نيز ننوشتن مصوت هاي کوتاه در داخل متن باعث مي شود که براي تلفظ صحيح اجباراً لاتين کلمات به صورت پانويس متن آورده شود که همين امر باعث اتلاف وقت و انرژي مي شود. که البته همين لاتين نويسي هم قاعده خاصي ندارد و هر ناشر و نويسنده اي سليقه خاص خودش را براي آوانويسي حروف فارسي به لاتين دارد. که به عنوان نمونه براي نشان دادن حرکت فتحه و الف و آ هيچ گونه هماهنگي در کتاب ها و خصوصا فرهنگ هاي مختلف ديده نمي شود. ”هر چند برخي معتقدند همين ننوشتن حرکات مزيتي است و موجب تندنويسي مي شود“[5].
2.براي يک حرف چند علامت مختلف داريم مانند علامت هاي (س،ص، ث) که هر سه در فارسي يکسان خوانده مي شوند و هم چنين (ذ، ز، ض، ظ) و نيز (ت، ط). البته اين امر در زبان انگليسي هم وجود دارد چنان که «ف» ممکن است به شکل هاي «F. GH. PH. V » باشد.
3.يک علامت را براي دلالت بر چند حرف مختلف استعمال مي کنيم مانند "و" که پنج مورد نوشتن دارد يکي براي بيان ضمه در کلمات "خوش" و "تو". ديگر بيان مصوت ممدود يا "واو ماقبل مضموم" مانند "شور" و "او". سوم بيان حرف صامت "واو" در کلماتي چون "آواز" و "والي" و "عفو" . چهارم بيان حرف مصوت مرکبي که در کلمات "نو" و "جوشن" و مانند آن هاست. پنجم حرفي که در زبان کنوني خوانده نمي شود مانند "واو معدوله" در کلمات "خواهر" و "خواستن" و "واو" در کلمه "عمرو"[6]
4.حرف هايي هم هست که در کلمات خاصي از نوشتن حذف مي شود مانند "الف" در کلمات "اسحق" و "اسمعيل" و "الله"
5.نقطه هايي متعدد در بالا و پايين حرف که هم سبب دشواري و هم موجب اشتباه در خواندن مي شود. اهميت بيش از حد نقطه درخط فارسي هنگام تشخيص نوري کاراکترها[7] توليد اشکال اساسي مي کند. به عنوان مثال در نظر بگيريد که تفاوت ‹ر› و ‹ز› و يا تفاوت ‹د› و ‹ذ› و يا تفاوت ‹ب› ‹ت› ‹ پ› ‹ث› فقط در نقطه است و چون نقطه جزء بسيار کوچکي است در اين امر مشکلات زيادي را فرا روي متخصصين قرار مي دهد. و يا کلمات زير را در نظر بگيريد که با يک يا چند نقطه عوض مي شوند (بر، بر، پر، پر، تر، پز، پز، بز، تِز).
6. يک عيب ديگر هم که براي خط فارسي ذکر کرده اند اين است که از راست به چپ نوشته مي شود. و براي اين مورد دلايل مختلفي ذکر شده است از جمله عدم هماهنگي و ايجاد مشکل در نوشتن متون رياضي و شيمي و نت هاي موسيقي و دستورات شطرنج و اين که خط تصويري يعني علايم گرافيکي که در کل جهان استفاده مي شود مانند علايم راهنمايي و رانندگي تماماً از چپ خوانده مي شوند.
7.پيوسته نويسي و جدا نويسي کلمات مرکب که در اکثر موارد به صورت سليقه اي عمل مي شود مانند تنوع استفاده از ‹مي› چسبان و غير چسبان و يا تنوع نحوه به کار بردن «علامت هاي جمع ‹ها، ان، جات› ، هم، هيچ، که، (ضماير شخصي متصل مان، تان، شان)، شناسي، را، چه، چون، تر، ترين، بي (پيشوند نفي)، به، اي (نشانه ندا)، آن و اين» در کلمات به صورت پيوسته و يا جدا گانه: (آنچه ، آن چه)؛ (همچنانکه، همچنان که) ؛ (جنابعالي، جناب عالي)؛ (هيچکس، هيچ کس) ؛ (ميتواند، مي تواند)؛ (آن ها، آنها) در اين مورد کلماتي که پيشوند و يا پسوند دارند نيز در شکل هاي مختلف نوشته مي شوند. برخي از کلمات در دو شکل متصل نويسي و منفصل نويسي به دو شکل مختلف ظاهر مي شوند، مانند «علاقمند و علاقه مند؛ انديشمند و انديشه مند». مصدرها و فعل هاي مرکب و اسم هاي مشتق از آنها نيز به دو صورت متصل و منفصل نوشته مي شوند مانند «نگه داشتن و نگهداشتن». در جستجوي مطالب از اينترنت اين مورد توليد اشکال مي کند چنانکه جستجوي «هيچ کس» نتايج متفاوتي را با جستجوي «هيچکس» مي آورد و يا جستجوي « کتاب شناسي » و «کتابشناسي» در موتور جستجوي گوگل نتايج متفاوتي را ارايه مي کند. اين گونه کلمات با اين که در خواندن متن اشکال کمي به وجود مي آورند و هر آشناي به زبان فارسي به راحتي مي تواند آن را بخواند اما در فن آوري امروزه و تجزيه و تحليل کلمات به کمک رايانه اشکال اساسي توليد مي کند و شايد اگر قاعده اي جامع و مانع براي آن وضع گردد، بتوان گفت بزرگ ترين مشکل خط فارسي حل شده است. منظور اين که، براي مثال خواندن سه کلمه «بي حوصلگي، بيحوصلگي، بي حوصله گي» مشکلي ايجاد نمي کند. اما در محيط الکترونيکي و شبکه اينترنت براي بازيابي اين کلمه بايستي براي تمام اشکال اين کلمه، جستجو را انجام دهيم، البته اگر آگاهي از تمام اشکال نوشتاري آن داشته باشيم.آآ
8.سي و دو حرف الفباي فارسي همراه با چهار علامت مد، همزه، تنوين، تشديد به 130 شکل مختلف ظاهر مي شوند و تفاوت اين اشکال در اتوماسيون خط فارسي توليد اشکال مي کند. « تنوع و تعدد نويسگان، يادگيري زبان و خط فارسي را براي آموزگار و آموزنده دشوار و براي نوآموز توان فرسا مي سازد. تعداد زياد نويسگان در رابطه با اتوماسيون زبان توسط رايانه مشکلاتي در خصوص تعداد و ترتيب قرار گرفتن نويسگان در جداول کد ايجاد مي نمايد و طراحان کد در جاي دادن اين تعداد نويسه در جداول با مساله کمبود جا رو به رو هستند. هر چند که مشکل جا با کد 16 بيتي حل شده است اما مسايل ديگري هم¬چنان باقي مي مانند که احتياج به برطرف شدن دارند»[8]
9. نوشتن ک و گ (ک گ ک گ گ ک) در اشکال مختلف نيز باعث سردرگمي و عدم جستجوي صحيح مي شود.
10. در اغلب اوقات يک فاصله اضافي معني متفاوتي و يا متضادي را مي دهد (مثل مادر ، ما در).
11. سه کرسي مختلف براي حرف هاي مختلف الفبا باعث مي شود که در مقايسه با اکثر زبان ها تعداد سطرهاي هر صفحه به مراتب بيش تر گردد چون برخي حروف روي خط کرسي قرار مي گيرند و برخي پايين خط کرسي و برخي بالاي خط کرسي مثل (ا ب م )
12.از آنجاييکه حروف در نوشتن غالباً به صورت چسبيده و پيوسته نوشته مي شوند و اين امر تشخيص حرف به حرف نوشته به وسيله رايانه را، دچار مشکل مي کند.
13. در او. سي. آر. فارسي هم چنين اعداد نيز مشکل ساز هستند چنانچه صفر در فارسي يک نقطه کوچک است که مي تواند رايانه را به اشتباه بياندازد و نيز اعداد 1 و 2 و 3 بسيار شبيه هم هستند و تفاوت شان در يک دندانه کوچک است.
14. تنوع املايي يا تنوع در رسم الخط بعضي از کلمات که همه شکل هاي آن نيز درست است مانند( اتاق و اطاق) و يا (امپراتور و امپراطور). و کلماتي که فقط يک شکل آنها صحيح مي باشد ولي شکل ناصحيح آن نيز زياد استفاده مي شود مانند «ذغال و زغال؛ خوشنود و خشنود». البته اين جداي از تنوع در مفهوم کلمات است که در ديگر زبان ها نيز وجود دارد، يعني براي بعضي از مفاهيم ممکن است کلمات متنوعي استفاده بشود. مانند کامپيوتر و رايانه.
15. بکار بردن همزه درصورت هاي مختلف مانند (مساله، مسيله) ؛ (مسيول، مسوول)
16. استفاده از ‹ا› و ‹آ› به جاي يک¬ديگر مانند (فرايند و فرآيند).
17. شکل هاي مختلف ضبط نام¬هاي بيگانه در فارسي: ورود واژه هاي بيگانه معمولا از راه ورود پديده هاي فرهنگي نو در عرصه هاي مختلف فني ، علمي، اجتماعي، سياسي و هنري و .... و يا از طريق افراد دو زبانه انجام مي گيرد که به قرض گيري زبان معروف است و کم و بيش در تمام زبان ها وجود دارد. واژه هاي بيگانه اغلب براي پر کردن خلاء واژه هاي علمي و يا ارتباطي سودمند هستند، اما وجود آن ها مسايلي از قبيل چگونگي ضبط آن ها در زبان قرض گيرنده را به وجود مي آورد. براي ضبط واژه هاي قرضي به سبب اختلاف فاحش نشانه هاي الفباي فارسي با نشانه هاي الفباي خارجي مشکلات جدي وجود دارد. از جمله اين که الفباي فارسي آوانگار نيست و به همين جهت در ضبط دقيق تلفظ واژه هاي زبان فارسي نيز ناتوان است و اين ناتواني در ضبط واژه هاي بيگانه به مراتب بيش تر است و اين که در مورد برگردان اسامي خارجي به خط فارسي قاعده خاصي وجود ندارد و هر کس بنا بر سليقه و ذوق خود اين کار را انجام مي دهد که در نتيجه يک کلمه واحد به صورت هاي مختلف نوشته مي شود. براي مثال (اتومبيل و اتوموبيل)؛ (کلسيم، کلسيوم، کالسيوم) و يا اسم Franklin به صورت (فرانکلين، فرانکلن، فرنکلين، فرنکلن) ضبط شده است. خانم صديق بهزادي اين مشکلات را به سه دسته تقسيم کرده است: ” 1- نام هايي که در برگردان آن ها هم خوان ها ايجاد مشکل مي کنند. 2 – نام هايي که در برگردان آن ها واکه هاي ساده مشکلاتي را به وجود مي آورند . 3 – و سوم نام هايي که در برگردان آن ها مشکل اصلي مربوط به واژه هاي مرکب است[9].
18.استفاده يا عدم استفاده از ‹ي› در کلمات مختوم به ‹الف › مانند (موسي و موسا).
19.استفاده يا عدم استفاده از ‹ء› براي کلمات مختوم به هاي بيان حرکت در حالت مضاف مانند (خانه مسکوني و خانهء مسکوني و يا خانه ي مسکوني).
20.استفاده يا عدم استفاده از اعراب براي کلمات.
21.انواع مختلف جمع براي يک واژه مفرد: به عنوان مثال جمع بستن يک واژه با علايم جمع فارسي وعلايم جمع عربي و نيز جمع بستن بي قاعده (جمع مکسر)، استفاده ازجمع جمع، مانند (معلم، معلمين، معلمان، معلم ها).
22.تنوين هاي زبان عربي نيز از جمله دشواري هاي رعايت اصل هم خواني نوشتاري و گفتاري هستند.
23.در نگارش ياء وحدت يا نکره در آخر کلماتي که به هاء مختفي يا غير ملفوظ ختم مي شوند سه نوع املاء ديده مي شود. (خانه اي، خانه يي، خانه ).
24.کلمه هاي عربي در شکل هاي گوناگون در زبان فارسي نوشته مي شوند. (مبدا، مبداء)؛ (ابتدا، ابتداء)؛ (نسبتاً، نسبته، نسبتا) و ....
25.ناتواني خط فارسي در نشان دادن تلفظ واژه هاي ايران باستان و ميانه و گويش ها و لهجه هاي ايراني و واژه هاي بيگانه حتي با نشانه ها.
26.وجود دندانه هاي متعدد درکلمات خواندن کلمات و به خصوص در او.سي.آر. فارسي ايجاد اشکال مي کند مانند کلمات: نشستن و استشهاد.
27. حروف فارسي غالباً مشابه اند و با اندگي غفلت به جاي هم نوشته مي شوند و مطلب را به کلي دگرگون مي کنند مانند (در، رد، ور).
زبان و خط فارسي در اينترنت :
حجم اطلاعات به زبان فارسي در روي اينترنت در اشکال مختلف آن به سرعت رشد کرده است. در حال حاضر توسعه وبلاگ هاي فارسي و سايت هاي علمي و تبليغاتي و دانشگاهي به زبان فارسي باعث شده است که جايگاه زبان فارسي تا حد زبان اول ارتباطات اينترنتي نزد ايرانيان و فارسي زبانان در سراسر جهان ارتقا يابد. شايد بتوان گفت که اولين مرجع وبلاگ نويسي فارسي با انتشار راهنماي ساخت وبلاگ فارسي آغازشده است. بدون شک دومين موج نيز با شروع به کار سايت پرشين بلاگ که امکان راه اندازي وبلاگ براي کاربران فارسي زبان را با سهولت بيش تري فراهم مي کند آغاز شده است. اما پيامد قابل توجه ديگري که رشد وبلاگ نويسي در ايران داشته است پيدايش سايت هاي اينترنتي فارسي زباني است که صاحبان وبلاگ ها ايجاد کرده اند و اين خود موج جديدي از گسترش کاربرد اينترنت در جامعه ايران به حساب مي آيد. اکنون روي آوردن برخي از روزنامه نگاران ، پژوهش¬گران، دانشجويان و .... به وب فارسي و استفاده از منابع خبري و علمي و .... آن موجب تقويت نقش رسانه اي وب فارسي شده است. پديده ديگري که باعث گسترش زبان و خط فارسي در اينترنت شده است ايجاد کتابخانه هاي ديجيتالي فارسي در شبکه جهاني است، با اين که از شکل گيري کتابخانه هاي فارسي در شبکه جهاني مدت زيادي نمي گذرد با اين حال به سرعت در حال رشد و گسترش است. شماري از اين کتابخانه ها در پايگاه هاي اينترنتي شکل گرفته اند و بسياري وبلاگ هايي هستند که براي اين کار راه اندازي شده اند. از ويژگي هاي اين کتابخانه ها اين است که هيچ يک جنبه تجاري ندارند و نيز به جز عده معدودي اکثر کتابخانه ها کوشيده اند جانب بي طرفي را رعايت کرده و از اعمال سليقه شخصي پرهيز کنند. آنچه در بسياري از کتابخانه هاي مجازي فارسي در دسترس است تنها شامل کتاب نيست بلکه نوشته هايي اعم از داستان ، مقاله، تک نگاشت و .... نيز در ميان مجموعه ها ديده مي شود. هم چنين است آثاري که احتمالاً هيچ گاه چاپ کاغذي ندارند و البته وجود کتاب هايي که مدت هاست ناياب اند و مجال انتشار دوباره نيافته اند و يا آثاري که امروز به دلايلي بازچاپ آن ها مقدور نيست از جاذبه هاي کتابخانه هاي مجازي اند. در اينجا شماري از اين کتابخانه ها ذکر مي شوند: پايگاه اينترنتي کتاب هاي رايگان فارسي، پايگاه اينترنتي باني تک، کتابخانه مجازي داستان هاي فارسي، آواي آزاد، پايگاه اينترنتي خوابگرد، کتابخانه دوات، پايگاه اينترنتي سخن، وبلاگ کتابخانه هرمس، پايگاه اينترنتي گفتمان، پايگاه تاريخ و فرهنگ ايران زمين، پايگاه مرکز جهاني اطلاع رساني آل البيت، کتابخانه پايگاه اينترنتي حوزه، پايگاه اينترنتي امام علي (ع)، پايگاه اينترنتي کتابخانه ديجيتال و .... که لازم به ذکر است غلبه با کتاب هاي دو حوزه ادبيات و دين است.[10]
کاربران به دلايل مختلفي از قبيل" دسترسي آسان و ارزان به حجم عظيم اطلاعات ، عدم نياز اطلاعات يافته شده از اينترنت به تايپ مجدد ، دسترسي سريع و اطلاعات جديد، صرفه جويي در وقت و مهم ترين دليل، عدم تسلط اکثر کاربران به زبان انگليسي "که زبان غالب بر اينترنت است" به دنبال اطلاعات فارسي از اينترنت هستند. گسترش زبان و انبوهي از نوشتارها ايجاب مي کند که خط ضابطه داشته باشد و از سوي ديگر پيشرفت فن آوري و پيدايش اينترنت خواستار ضابطه و قانونمندي است. اطلاع رساني که جنبه بين¬الملي پيدا کرده است بدون دستورِ خطي سامان يافته و نظام مند ميسر نيست و دست کم دشواري ها مي آفريند. در حال حاضر وبلاگ¬هاي فارسي مقام دوم يا سوم را در جهان دارا مي¬باشد. به نظر دکتر آشوري“ اگر زبان فارسي به همين صورت بي¬دقت در اينترنت به کار رود در سطح زباني براي تفنن باقي خواهد ماند و کم¬تر حرفي جدي به اين زبان زده خواهد شد. آينده زبان فارسي در اينترنت بستگي به اين دارد که نويسندگان فارسي تا چه حد کار خود را جدي بگيرند و اين زبان را بازسازي کنند که از لحاظ قدرت بيان و دقت مفاهيم و استواري ساختار دستوري به زبان انگليسي نزديک شود“.[11] نبود استاندارد ثابت رسم الخط فارسي موجب اين شده است که به تعداد صفحات وب فارسي سبک و سياق نگارش به کار رفته باشد لکن مي توان چنين ارزيابي نمود که اکثر وب هاي فارسي در برخي خصوصيات مشترک مي باشند از جمله اين که نگارش برخي از آن ها زبان غير رسمي و محاوره اي مي باشد و به خصوص در متون علمي اغلب واژه هاي بيگانه به دفعات استفاده مي شود. رسم¬الخط مورد استفاده نيز متفاوت و سليقه اي است و برخي از آن ها غلط هاي تايپي و نگارشي فراواني دارند و اين خصوصيات، اغلب به جهت محدوديت هاي محيط الکترونيکي و عدم تطابق رسم الخط فارسي با آن مي باشد که نمايه سازي و سپس جستجو به اين زبان را با دشواري هايي رو به رو مي سازد.با توجه به اين نکته که اطلاعات ارزشمند فراواني در اينترنت وجود دارد و اينترنت با شتابي فراوان به يک منبع اطلاعاتي ممتاز تبديل شده است. موتورهاي جستجو به عنوان يکي از اساسي¬ترين دروازه¬هاي ورود به منابع اينترنتي داراي ضعف¬هايي هستند. که مي¬توان به اين موارد اشاره کرد:
- در يک مجموعه از يافته¬هاي بازيابي شده مدخل¬هاي تکراري فراواني ملاحظه مي¬شود.
- نتايج غير قابل پيش¬بيني هستند.
- نتايج چه بسا گمراه کننده باشند: ممکن است جستجويي در يک موتور کاوش نتيجه¬اي نداشته، ولي در موتور ديگر داراي يافته¬هاي فراوان باشد.
- موتورهاي کاوش محتويات پايگاه¬هاي اطلاعاتي خودشان را نشان نمي¬دهند و از معيارهايي که براي گنجاندن يک مدرک در فايل¬هايشان دارند حتي شرحي ارايه نمي¬کنند.
- مهار واژگاني وجود ندارد و قواعد نقطه¬گذاري و بزرگ¬نويسي نيز استاندارد نيست.
- بدون بررسي عملي هر عنصر، اغلب نمي¬توان ميزان ربط و رابطه¬ها را تحليل کرد. يعني اطلاعات کافي در مدخل نمايه نيست تا فرد بتواند دست به انتخاب بزند.[12]
- عدم توان موتورهاي جستجو در تمايز ميان مدارکي که توسط فرد الف نوشته شده و مدارکي که در باره فرد الف نوشته شده است.
- منابع قابل توجهي در شبکه وب وجود دارند که توسط موتورهاي جستجو نمايه نمي¬شوند. به اين بخش از وب اصطلاحاً وب نامريي مي¬گويند. "وب نامريي بخش بزرگي از وب است که موتورهاي جستجو آن¬ها را نمايه نمي¬کنند يا نمي¬توانند نمايه کنند و عبارتند از: سايت¬هاي داراي رمز عبور، فايل¬هاي پي. ¬دي¬. اف از متون آرشيو شده، ابزارهاي تعاملي نظير ماشين حساب¬ها و برخي از واژه¬نامه¬ها و همچنين بعضي از پايگاه¬هاي اطلاعاتي، منابع محافظت شده از طريق اسم کاربر و گذرواژه، منابع و صفحات وب بدون پيوند و صفحات افزون بر حداکثر تعداد صفحات قابل مرور"[13].جستجوي اطلاعات در اينترنت به دو روش مي تواند صورت گيرد يکي استفاده از جملات زبان محاوره اي است و ديگري بکارگيري کلمات کليدي. در روش استفاده از جملات زبان محاوره اي که اغلب به کاربران تازه کار پيشنهاد مي گردد، مورد سوال خود را در قالب يک جمله سوالي مطرح مي سازند. ¬يکي از عيب هاي بزرگ اين روش تعداد نتايج جستجوي زيادي است که بازگردانده مي شود. به همين دليل اين روش توسط کاربران حرفه اي و حتي توسط همه، کم¬تر استفاده مي شود. اما چنانچه از اين روش استفاده بشود بايستي سعي در انتخاب بهترين نوع جمله بشود و توصيه مي شود در انتخاب يک يک کلمات لحظه اي درنگ نموده و با ظرافت خاصي جمله نهايي را مطرح نمود. يکي از کاراترين و مقتدرترين روش-هاي جستجوي اطلاعات در دنياي وب استفاده از واژه هايي است که اصطلاحاً کلمات کليدي ناميده مي شوند. اغلب کاربران حرفه اي و جستجوگران ورزيده دنياي اينترنت مي توانند با طرح بهترين کلمات کليدي و بکار بستن قوانين ترکيب آن ها با هم براي نيازهاي اطلاعاتي خود پاسخي در خور بيابند. در اين روش توصيه هاي زير براي انتخاب کلمات کليدي و نيزجستجوي دقيق و مفيد پيشنهاد مي شود:
1- حتي المقدور سعي شود کلمات کليدي از ميان اصطلاحات منحصر به فرد و اسامي خاص انتخاب بشود.
2- حتي المقدور از آوردن کلمات عمومي که عناوين بسياري را در زير مجموعه خود شامل مي شوند جداً خودداري کنيد.
3 – هميشه اسم شخص يا نام شي يا هر چيز ديگري را که مد نظر داريد بطور کامل وارد کنيد.
4 – دقت کنيد که اگر موتور جستجو ميان حروف بزرگ و کوچک تفاوتي مي گذارد، اين مسيله را در طرح کلمات کليدي خود مد نظر داشته باشيد.
5 – در نظر داشته باشيد اگر نتيجه جستجو صفر بود به احتمال زياد مي تواند از يک اشتباه تايپي باشد.
6 – اگر املاي صحيح و کامل کلمه اي را نمي دانيد از کارکتر جانشين که اغلب * و يا ؟ است استفاده کنيد.
7 – اگر يک کلمه کليدي را براي طرح دقيق و تمام و کمال يک مورد جستجو کفايت نمي کند از تکنيک هاي جستجوي عبارتي، استفاده از اپراتورهاي جبر بولين (AND, OR, NOT) استفاده کنيد. جستجوي عبارتي يکي از مهم ترين و قدرتمندترين امکانات جستجو در اغلب موتورهاي جستجو مي باشد و مي توان يک عبارت يا جمله مشخص را به همان ترتيبي که کلمات وارد شده اند مورد جستجو قرار داد. براي اين روش جستجو عبارت مورد نظر را داخل گيومه"" بگذاريد
8 - استفاده از عملگر AND : and به مفهوم "و" براي محدود کردن دامنه جستجو از طريق ترکيب کليدواژه هاي مختلف به کار مي رود و براي ترکيب کليدهاي جستجو زماني که براي شما مهم است که دو يا چند کلمه کليدي حتماً وجود داشته باشد و علامت آن در پايگاه هاي مختلف به صورت استفاده از عبارت and ،استفاده از + ، انتخاب عبارت all the word از منو، انتخاب عبارت match on all words (and) بوسيله کليک کردن بر روي دکمه هاي راديويي مي باشد.
9 – استفاده از عملگر OR: اپراتور OR به مفهوم "يا" و برخلاف عملگر AND باعث گسترش دامنه جستجو و بازيابي اطلاعات بيش تر شده براي ترکيب کليدواژه هاي جستجو زماني که انتظار داريد تنها يک، دو يا چند کلمه کليدي حضور داشته باشند و علامت آن استفاده از عبارت or، نحوه اجراي ساده و معمولي آن، انتخاب عبارت any of the words از منو، انتخاب عبارت match on any words (or) با کليک بر روي دکمه هاي راديويي مي باشد. يکي از کاربردهاي مهم اين عملگر پوشش مفاهيم يا اصطلاحات مترادف، مرتبط، يا با املاهاي متفاوت مي باشد.
10 – استفاده از عملگر NOT : اپراتور Not به مفهوم "نه" و يا به جز که در اين صورت تمامي جواب هاي بازگشتي که حاوي عبارت يا کلمه کليدي هستند حذف خواهند گرديد و براي اجراي آن تنها کافيست که not را قبل از عبارت يا کلمه کليدي مورد نظرتان با يک فاصله بياوريد.
11 – استفاده از کوتاه سازي [14]کليد واژه ها: اين تکنيک به ما امکان مي دهد که با وارد کردن بخشي از يک کليدواژه بتوانيم مشتقات مختلف آن را نيز در فرآيند جستجو بازيابي کنيم. اکثر موتورهاي جستجو اين تکنيک را با استفاده از علامت ستاره (*) ارايه مي دهند. يکي از مشکلات استفاده از اين تکنيک اين است که باعث بازيابي اطلاعات غيرمرتبط و ناخواسته زيادي مي شود.
12 – استفاده از عملگر نزديک يابي[15]: در بسياري از موارد استفاده از عملگر and باعث بازيابي اطلاعاتي شود که براي ما مفيد نمي باشد، به اين دليل که اين عملگر کليدواژه ها را در هر کجاي متن که باشند بازيابي مي کند. در اين موارد استفاده از تکنيک نزديک يابي مي تواند از ريزش کاذب اطلاعات و يا بازيابي اطلاعات غير مرتبط جلوگيري نمايد. همه موتورهاي جستجو قابليت استفاده از اين تکنيک را ندارند ولي به عنوان مثال در موتور جستجوي آلتاويستا مي توان با استفاده از عملگر NEAR از اين تکنيک استفاده نمود.
13 – جستجوي ترکيبي با استفاده از پرانتز: اين تکنيک يکي از مهم ترين تکنيک هاي جستجو مي باشد که به وسيله آن مي توان تا حدود زيادي از بازيابي موارد غير مرتبط در محيط وب جلوگيري کرد. در اين روش مي توان از همه عملگرهاي جستجو که در بالا گفته شده يک جا استفاده کرد و آن ها را با هم ديگر ترکيب نمود.
14 – جستجوي کليدواژه در عنوان صفحات وب: اين تکنيک با اين پيش فرض که عنوان يک صفحه وب تا حدود زيادي نمايان گر محتواي اطلاعات موجود در آن است به جستجوي واژه هاي کليدي در عنوان سايت ها مي پردازد. علامت آن در موتورهاي جستجو متفاوت است ولي اغلب موتورهاي جستجو از طريق فهرست انتخابي و يا گزينه هاي ديگر اين امکان را فراهم مي آورند.
15 – جستجوي حوزه سايت ها: با توجه به اين که به صورت قراردادي هر کشوري حوزه خاصي در محيط وب دارد، قابليت جستجوي حوزه سايت ها به ما اين امکان را مي دهد که فرايند جستجو را به حوزه خاصي نظير سايت هاي وب ايران (ir) و يا سايت هاي وب سازمان هاي غير انتفاعي (org) محدود کنيم. دستورات استفاده از اين تکنيک در موتورهاي جستجو مختلف مي باشد.
16 – محدود کردن جستجو به زبان هاي مختلف؛ باعث مي شود نتايج جستجو به زبان هاي ديگر آورده نشود و انتخاب مطلب مورد نظر آسان تر است.
17 – محدود کردن جستجو به تاريخ انتشار منابع در وب: تاريخ انتشار يا به اصطلاح روزآمدي مطلب به خصوص در منابع علمي اصل مهمي است و اين گونه محدوديت باعث مي شود بنا به نياز کاربر جديدترين و يا قديمي ترين منبع بازيابي بشود.
18 – جستجوي رسانه هاي مختلف: موسيقي، عکس، ويديو : زماني که فقط نوع خاصي از رسانه مورد نياز است به عنوان مثال زماني که به عکس يک شخصيت نياز داريم، جستجو در ميان عکس ها باعث مي شود نتيجه جستجو شامل اطلاعات ديگري در مورد آن شخصيت نباشد.
19 – جستجوي صفحات با فرمت هاي مختلف: PDF, Word, MP3, MPEG, ….: زماني که فرمت خاصي مورد نظر است مي توان از اين تکنيک استفاده کرد . به عنوان مثال اگر مايل باشيم منبع بازيابي شده در فرمت PDF باشد، اين تکنيک مي تواند مفيد باشد.
20 – آگاهي از پيش فرض هاي جستجو در موتور جستجو: با توجه به اين که هر موتور جستجو براي ترکيب واژه ها يک پيش فرض دارد و اگر از هيچ گونه عملگري استفاده نشود، کليدواژه ها را به صورت پيش فرض با يکي از عملگرهاي جبر بولي ترکيب مي کند؛ آگاهي از اين پيش فرض موتورهاي جستجوي مختلف مهارت ما را در جستجو بالا مي برد.
21 – وب نامريي: وب نامريي به دو دليل کمي و کيفي اهميت دارد کمي از اين نظر که موتورهاي جستجو فقط قادر هستند حدود 16 درصد از اطلاعات موجود دراينترنت را بازيابي کنند و اندازه وب نامريي تقريبا 500 برابر وب مريي است و کيفي از اين نظر که منابع اطلاعاتي موجود در وب عميق معمولا ارزشمند و مفيد هستند و در بسياري از موارد پاسخ¬گوي نياز کاربران مي¬باشند. آشنايي با ابزارهايي که براي شناسايي منابع وب نامريي به وجود آمده¬اند و کاربران را به سايت¬هاي مناسب راهنمايي مي¬کنند، باعث دسترسي به اين بخش عظيم از اطلاعات مفيد و ارزشمند مي¬شود. مثل سايت Invisibleweb که فهرستي از منابع نامريي را و سايت Completeplaset که فهرستي از تقريبا 40000 پايگاه اطلاعاتي وب نامريي را ارايه مي¬دهد.[16]
راهبرد جستجو در اينترنت
جستجو عبارت از جستجو در منابعي مشخص با استفاده از کليدواژه ها و عبارت هاي خاص در حوزه هاي موضوعي ويژه است. طراحي نظام مند مراحل انجام يک جستجو را راهبرد جستجو مي گويند به نظر پايو «راهبرد جستجو عبارت است از فرايندي که از طريق آن فايلي مورد جستجو قرار مي گيرد تا مدارک متناسب با نياز کاربر شناسايي شود. اين مدارک بر اساس مجموعه اي از معيارهايي که شخص متقاضي مطرح مي کند بازيابي مي شود»[17] هر فرايند جستجو مي تواند به مراحل ارايه درخواست دقيق، انتخاب منابع اطلاعاتي مناسب، آماده کردن جستجو و اجراي جستجو تقسيم شود. بر خلاف منابع نمايه سازي شده در پايگاه هاي اطلاعاتي کتاب شناختي؛ مدارک در اينترنت از طريق واژگان کنترل شده قابل بازيابي نيستند. بنابراين جستجوگر براي بازيابي بايد بر فنون خاص اينترنت متکي باشد. نخست آگاهي از ابزارهاي مختلف جستجو در اينترنت و در ادامه انتخاب يکي از اين ابزار براي جستجوي اطلاعات مورد نياز مي باشد. هزاران موتور جستجو، صدها ابرموتور جستجو و راهنماهاي موضوعي وب و پايگاه هاي تخصصي وجود دارد و انتخاب درست ابزار جستجو در ابتداي کار جستجو مي تواند يک جستجوي موفق را باعث گردد. در زير چند معيار براي انتخاب ابزار جستجو آورده مي شود:
- اگر در جستجوي اطلاعات خاصي باشيد بهتر است از موتورهاي جستجو استفاده کنيد.
- اگر در جستجوي يک واژه مبهم يا منحصر به فرد هستيد از ابرموتورهاي جستجو استفاده نماييد.
- اگر در جستجوي اطلاعات عمومي روي موضوعات عام هستيد از راهنماهاي موضوعي وب استفاده کنيد.
- اگر در حال جستجوي اطلاعات علمي هستيد از کتابخانه هاي مجازي استفاده کنيد.
- اگر در جستجوي آخرين اطلاعات يا براي تغيير پوياي فهرست مطالب، آخرين خبرها، راهنماهاي دفتر تلفن، دسترسي به زمان پروازهاي هوايي و غيره هستيد از پايگاه هاي تخصصي استفاده کنيد.[18] براي جستجوي اطلاعات از اينترنت چهار شيوه وجود دارد شيوه نخست دسترسي به اطلاعات از طريق نشاني پايگاه اطلاعاتي مورد نظر بر روي اينترنت (URL) است، که در اين صورت نشاني پايگاه اطلاعاتي در سطر نشاني برنامه مرورگر وب تايپ مي شود و برنامه مرورگر وب مراجعه کننده را به وب سايت آن نشاني هدايت خواهد کرد. اما اگر فقط يک حرف يا علايم نقطه گذاري از قلم بيفتد، برنامه مرورگر نخواهد توانست آن پايگاه را باز نمايد. روش دوم دنبال کردن لينک هاي موجود در صفحات وب است که کاربران را از صفحه اي به صفحه ديگر هدايت مي کند. اين سهولت دسترسي به منابع در وب از امتيازات بزرگ آن است و براي کاربران امکان مرور سريع و آسان در منابع مختلف را فراهم مي کند. روش سوم بازيابي گزينشي اطلاعات است که در آن در واقع به جاي آنکه کاربران شخصا در جستجوي اطلاعات مورد نظر باشند، موضوعات مورد نياز خود را به سيستم¬هاي بازيابي گزينشي مي سپارند و سپس در طول زمان، اطلاعات دريافتي جديد توسط سيستم براي آنها به طور خودکار ارسال خواهد شد. چهارمين روش که در واقع معمول ترين و متداول ترين راه بازيابي اطلاعات در وب است استفاده از موتورهاي جستجو است. هنگام جستجو بايد دقت کرد که موتور جستجو به طور معمول هوش مند نيست و معمولاً به دنبال کليه کليدواژه هايي که شما به دستگاه داده ايد بدون توجه به معناي آن ها مي گردد.
نکات کليدي جستجو به زبان فارسي
براي جستجوي مطالب فارسي طبق گفته هاي پيشين چنانچه آدرس سايت به خصوصي که در زمينه موضوعي مورد نظر ما فعاليت مي کند را داشته باشيم؛ مي توان مستقيماً به آن سايت رفته و از مطالب آن استفاده نمود. به عنوان مثال سايت تخصصي برنامه نويس مطالب مفيدي در زمينه رايانه و علوم وابسته، به ما ارايه مي دهد و يا سايت عمران در زمينه موضوعي عمران فعاليت مي نمايد و نيز سايت هاي انجمن رياضي در زمينه رياضي، سايت انجمن فيزيک ايران در زمينه فيزيک، سايت انجمن روان¬شناسي ايران در زمينه روان¬شناسي و علوم تربيتي فعاليت مي نمايند، مرکز اطلاعات و مدارک علمي ايران با دارا بودن پايگاه هاي اطلاعاتي مختلف مخصوصا پايگاه پايان نامه ها مي تواند مورد استفاده متخصصين تمام رشته ها گردد. ولي چنان¬چه امکان استفاده از اين سايت ها نباشد و يا آدرس اين سايت ها را نداشته باشيم بايستي مطلب مورد نظر خود را بوسيله يکي از موتورهاي جستجو پيدا بکنيم. انتخاب موتور جستجو عامل مهمي در فرايند جستجو است. در حال حاضر ابزارهاي کاوش مختلفي در ايران ظهور پيدا کرده¬اند. ليکن ابزارهاي جستجويي که امکان جستجوي اطلاعات به زبان فارسي را در اختيار قرار مي دهند، محدودند. از طرف ديگر، امکانات و قابليت هاي آن ها براي بازيابي موثر و مناسب اطلاعات متغير هستند. برخي از ابزارهاي کاوش با امکانات جستجوي فارسي عبارتند از: ان.پي. ايرانNPiran ، ايران هوIranhoo ، ايران مهرIranMehre ، پارسيک Parseek ، گوگل Google. در بين ابزارهاي کاوش فوق ، تنها موتور کاوش گوگل داراي برنامه روبات به منظور شناسايي و نمايه¬سازي صفحات يا سايت¬هاي وب به زبان فارسي و نمايه¬سازي خودکار مي¬باشد و قادر است صفحات فارسي را در قالب يوني کد شناسايي و در پايگاه خود نمايه کند و سايت پارسيک نيز از پايگاه گوگل براي جستجو و بازيابي اطلاعات استفاده مي¬کند. به تعبير ديگر، چهار ابزار کاوش ديگر توسط نمايه سازي انساني اداره مي شوند و از اين لحاظ راهنماي موضوعي تلقي مي شوند و انسان، فرآيند شناسايي، بررسي و نمايه سازي سايت ها يا صفحات وب را بر عهده دارد.[19]معمولاً به جهت دامنه وسيع موضوعي و نيز صفحه به زبان فارسي گوگل اکثر کاربران از اين موتور جستجو استفاده مي نمايند. براي جستجوي بهتر توجه به نکات زير ضروري به نظر مي رسد:
- با ترکيب چند واژه کليدي مهم خيلي سريع مي توانيم مطلب مورد نظر خود را بدست بياوريم.
- دقت در انتخاب کليد واژه ها به طوري که واژه هاي انتخابي بطور دقيق نماينده نياز اطلاعاتي ما باشند کمک خواهد کرد تا از نتايج جستجوي گسترده اي که در اکثر موارد بار اطلاعاتي مفيد ندارند دوري گزينيم.
- استفاده از تکنيک جستجوي عبارتي که در آن عبارت جستجوي مورد نظر خود را داخل گيومه" " مي گذاريم و به اين ترتيب به موتور جستجو مي گوييم که مطلب مورد نظر ما بايستي عين اين عبارت باشد، نيز در محدود کردن نتايج جستجو کمک فراوان مي کند.
- استفاده از انواع محدودگرهاي زباني، زماني، مکاني، شکلي، و موضوعي و ... در جستجوي پيشرفته گوگل به ما در رسيدن سريعتر به مطلب مورد نظر کمک فراواني مي کند.
- به علت اين که منابع و اطلاعات موجود در اينترنت بوسيله افراد مختلف و بدون کنترل در شيوه هاي رسم الخط و بدون ويرايش صاحب نظران منتشر مي گردد آشنايي با گونه هاي مختلف نوشتاري و املاهاي مختلف يک واژه و يا يک مفهوم در زبان فارسي به ما کمک مي کند که با جستجوي گونه هاي مختلف نوشتاري يک واژه يا يک مفهوم و استفاده از واژه هاي مترادف و متشابه و شکل هاي ديگر نوشتاري آن واژه و نيز استفاده از انواع شکل هاي جمع و مفرد يک واژه جامعيت جستجوي خود را بالا ببريم . به عنوان مثال براي جستجوي مطلبي در زمينه بتن بايستي آنرا به دو صورت «بتون» و « بتن» جستجو نماييم تا به تمام مطالبي که در زمينه بتن مي باشد دسترسي داشته باشيم و يا به عنوان مثال دوم براي جستجوي مطلبي در باره «آبگرمکن» براي دستيابي به همه اطلاعات موجود بايستي آن را به چهار شکل زير بنويسيم «آب گرم کن، آب گرمکن، آبگرم کن، آبگرمکن» واضح است که هر کدام از اين کلمات نتايج متفاوتي را در موتور جستجو بدست مي دهد. «استاد، اساتيد، استادان، استادها» «آمريکا، امريکا» «ييدروژن، هيدروژن» «آنلاين، پيوسته، درون خطي» از مثال¬هاي ديگري هستند که جستجو به تمام اين شکل ها جامعيت جستجوي ما را زياد مي کند و به ما در از دست ندادن مطالب مفيد کمک مي کند .
- با استفاده از عملگرهاي بولي، دقت جستجو را بالا برده و نتايج جستجوي کم و مفيدي را بدست بياوريم.
- مترادفات: با استفاده از شکل هاي مختلف مترادفات موجود براي يک مفهوم و هم چنين شبه مترادفات و يا حتي گاهي کلمات متضاد مثل بي سوادي و سوادآموزي در جستجو مي توان جامعيت جستجو را بالا برد.
- اسامي مشهور و اسامي علمي: آگاهي از شکل هاي مختلف اسامي علمي و مشهور عاميانه و اسامي تجاري يک پديده و يا وسيله و ... و استفاده از آن ها مي تواند جامعيت جستجو را بالا ببرد.
- با توجه به اين که در اکثر وب ها از واژه خارجي يک کلمه به همان صورت و با همان الفبا استفاده مي شود استفاده از شکل خارجي اين لغات و واژه ها نيز مي تواند جامعيت جستجوي ما را بالاتر ببرد.
- با توجه به اين که در برخي از سايت ها و نيز وبلاگ ها روش خاصي براي رفع مشکلات فارسي پيشنهاد کرده اند و واضح است که خودشان نيز از آن رسم الخط استفاده مي کنند، آگاهي از اين شکل هاي مختلف و جستجو به اين شکل ها مي تواند باعث جامعيت جستجو گردد. از اين موارد مي توان به حذف واو معدوله در برخي سايت ها و وبلاگ ها اشاره کرد که به عنوان مثال «خواهر» را به صورت «خاهر» مي نويسند و يا حذف تنوين در برخي منابع که به عنوان مثال «عملاً» را به صورت «عملن» مي نويسند. در نهايت اين که «در تشکيل صفحات وب فارسي ، جاي يک استاندارد حاکم بر عملکرد تاليف نويسندگان وب، خالي است. استانداردي که انتخاب بعضي کلمات داراي چندين رسم الخط و حتي انتخاب بعضي کلمات که بر مفاهيم متنوعي دلالت دارند را منحصر به فرد نمايد و مولفان را از طرفي ترغيب به انتخاب گونه زباني مناسب، براي تضمين کيفيت ارتباط و انتقال موثر پيام و از طرف ديگر موظف به حفظ سلامت زبان و رعايت استانداردهاي آن به عنوان يک وظيفه رسانه اي نمايد. ايجاد و گسترش چنين استانداردي به عهده "فرهنگستان زبان و ادب فارسي" و با هماهنگي انجمن ها و شوراهاي علمي يا صنفي انفورماتيک در ايران است. تعويق در تنظيم اين استاندارد ، با توجه به رشد روز افزون وب هاي فارسي زبان ، هزينه هاي جبران ناپذيري در بر خواهد داشت.»[20]
[1] بر گرفته از: محمد صابر راثي ساربانقلي. " بررسي مشکلات جستجو و بازيابي اطلاعات به زبان فارسي از اينترنت با مطالعه موردي بر روي کاربران مرکز اينترنت دانشگاه آزاد اسلامي واحد شبستر" . پايان¬نامه کارشناسي ارشد کتابداري و اطلاع¬رساني، دانشگاه آزاد اسلامي، واحد تهران شمال، 1384
[2] کارشناس ارشد کتابداري و اطلاع¬رساني دانشگاه آزاد اسلامي واحد شبستر
[3] accents
4 پرويز ناتل خانلري. زبان شناسي و زبان فارسي. (تهران: توس،1373). ص. 256
[5] مجتبي مينوي. مينوي بر گستره ادبيات فارسي، به کوشش ماه منير مينوي. (تهران: توس، 1380)، ص. 510
[6] واو معدوله واوي است که در اين زمان عموماً نوشته مي شود ولي خوانده نمي شود، مانند خواهش. اما در زمان قديم آن را با کيفيت خاصي تلفظ مي کرده اند و چون در هنگام تلفظ ضمه به فتحه عدول مي کرده اند، آن را واو معدوله ناميده اند. هنوز در برخي از لهجه ها تلفظ آن به صورت قديم مانده است. پيش از واو معدوله هميشه حرف «خ» و پس از آن يکي از حروف «د.ر.ز.س.ش.ن.و.ه.ي» آمده است.
[7] OCR= Optical Character Reader فرايندي که در طي آن يک وسيله الکترونيکي کاراکترهاي چاپ شده بر روي کاغذ را آزمايش مي کند و شکل آن¬ها را با بررسي الگوهاي تيره و روشن تعيين مي کند. پس از تعيين اشکال توسط اسکنر يا وسيله مورد استفاده براي خواندن، روش هاي تشخيص نوري کاراکترها براي تبديل اشکال به متون کامپيوتري مورد استفاده قرار مي گيرند. (فرهنگ تشريحي اصطلاحات کامپيوتري ميکروسافت. مترجم فرهاد قلي¬زاده نوري. [تهران: کانون نشر علوم، 1379]، ص. 445
[8] محمدصادق محقق زاده، کاظم زارعيان. "ارايه راه حل براي برخي مسايل اتوماسيون و نگارش فارسي" فصلنامه اطلاع رساني. (دوره 19، شمارهء 3 و 4) ص.
[9] ماندانا صديق بهزادي. "ناهماهنگي ضبط نام هاي بيگانه در فارسي" . فرهنگ (کتاب سيزدهم، زمستان 1371) ص.103- 116
[10] مجيد رهباني. "قند پارسي در شبکه جهاني: کتاب هاي ديجيتال و کتابخانه هاي مجازي فارسي در اينترنت. "جهان کتاب، (183) ص.
[11] "تابوي اصلاح خط". جام جم. (4 بهمن 1383)
[12] براندا پاريس سيبلي. " فهرست¬نويسي منابع اينترنت: سازماندهي وب در کتابخانه¬هاي محلي و غير آن" ترجمه محسن حاجي زين العابديني .فصلنامه اطلاع¬ رساني (دوره 16، شماره 3 و 4) ص. 1
[13] عبدالرسول خسروي. " وب نامريي" فصلنامه اطلاع¬رساني (دوره 20، شماره 1 و 2) ص. 53
[14] Truncation
[15] Proximity search
[16] عبدالرسول خسروي. " وب نامريي" فصلنامه اطلاع¬رساني (دوره 20، شماره 1 و 2) ص. 54
[17] ميرندا لي پايو. مفاهيم بازيابي اطلاعات. ترجمه اسدالله آزاد و رحمت الله فتاحي. (مشهد: دانشگاه فردوسي. 1378) ص. 314
[18] دانيل بازاک. "جستجوي وب بطور کارآمدتر: رهنمودها، فنون و راهبردها". مترجمين مريم اسدي، اکرم اسدي. مجله الکترونيکي مرکز اطلاعات و مدارک علمي ايران. شماره چهارم دوره دوم
[19] کيوان کوشا. "معيارهاي ارزيابي ابزارهاي کاوش اينترنت : مطالعه مقايسه اي بر روي ابزارهاي کاوش وب با واسط جستجوي فارسي" . مجله الکترونيکي کتابدار.
[20] محسن صديقي، کامران زماني¬فر. " روشي براي رفع چالشهاي محتوا کاوي وب هاي فارسي زبان"مجله الکترونيکي مرکز اطلاعات و مدارک علمي
منابع: 1- آزادي، قاسم." اينترنت: سازمان¬دهي و جستجو" . ابرار اقتصادي. 14.
2- ابوالقاسمي، محسن. تاريخ زبان فارسي. تهران: سمت، 1380.
3- احمدي فصيح، صديقه، "آشنايي با شبکه جهاني وب". فصلنامه اطلاع رساني، دوره 18، شماره 1 و 2.
4- اديب سلطاني، مير شمس الدين. راهنماي آماده ساختن کتاب: براي مولفان، مترجمان، ويراستاران، رسانه گران، کتابداران ....تهران، علمي و فرهنگي، 1381.
5- ------------ درآمدي بر چگونگي شيوه ي خط فارسي. تهران: اميرکبير، 1378.
6- اشرف زاده ، بهرام. "زبان فارسي در وبلاگ هاي فارسي".
http://www.persianfarsi.com/articles/zabaneweblog.htm
7- بازاک، دانيل، "جستجوي وب بطور کارآمدتر: رهنمودها، فنون و راهبردها" . مترجمين مريم اسدي، اکرم اسدي،
http://www.irandoc.ac.ir/data/E_J/vol2/Search_Web.htm
8- باقري، مهري. تاريخ زبان فارسي. تهران: قطره، 1378.
9- بهار، محمدتقي. سبک شناسي يا تاريخ تطور نثر فارسي. تهران: اميرکبير، 1370.
10- پايو، ميراندا لي. مفاهيم بازيابي اطلاعات. ترجمه اسدالله آزاد و رحمت الله فتاحي. مشهد: دانشگاه فردوسي، 1378.
11- "تابوي اصلاح خط". جام جم، 4 بهمن 1383.
12- خانلري، پرويز. زبان شناسي و زبان فارسي. تهران: توس، 1373.
13- خسروي، عبدالرسول. "وب نامريي". فصلنامه اطلاع رساني، دوره 20، شماره 1 و 2.
14- خلخالي، نازيلا، بررسي علمي شيوه ي خط فارسي. تهران: ققنوس، 1375.
15- خوانساري، جيران. ”تکامل وب و مقايسه ابزارهاي جستجو در اينترنت". فصلنامه اطلاع رساني، دوره 16، شماره 3 و 4.
16- داورپناه، محمد رضا. جستجوي اطلاعات علمي و پژوهشي در منابع چاپي و الکترونيکي؛ شامل حوزه هاي علوم، فني مهندسي ... .تهران: دبيزش، 1381.
17- دراگولانسکو، نيکلاي جورج. "ارزيابي کيفي وب سايت ها: ابزارها و معيارها". ترجمه غلام حيدري.
http://www.irandoc.ac.r/Data/E_J/vol4/haidari.htm
18- دشتي، افشين."بررسي سه پيشنهاد درشيوه نگارش خط فارسي حتا مثلن، خاهر". روزنامه شرق 10 تير 1383.
19- "دگرگونيهاي زبان و خط فارسي در محيط هاي رايانه اي: گفتگو با دکتر عاصي". پيام ارتباطات، 35.
20- "ده نکته براي جستجوي سريع درگوگل". دانشمند، 487.
21- رقابي، فرنوش؛ شريفي، شهرزاد." نگاهي به اينترنت و نقش آن در دستيابي به منابع رايگان پژوهش".
http://www.irandoc.ac.ir/data/E_J/vol3/sharfi_reghabi_2.htm
22- رهباني، مجيد. "قند پارسي در شبکه جهاني: کتاب هاي ديجيتال و کتابخانه هاي مجازي فارسي در اينترنت". جهان کتاب، 183.
23- رييسي، محمد رضا." OCR : آموزش الفباي فارسي به رايانه".
http://iranwsis.org/Default.asp?C=IRNW&R=&I=93
24- سيبلي، برندا پاريس." فهرست نويسي منابع اينترنت: سازمان¬دهي وب در کتابخانه هاي محلي و غير آن". ترجمه محسن حاجي زين العابديني . فصلنامه اطلاع رساني، دوره 16، شماره 3 و 4.
25- صديق بهزادي، ماندانا، "ناهماهنگي هاي ضبط نام هاي بيگانه در فارسي". فرهنگ. کتاب سيزدهم، زمستان 1371.
26- صديقي، محسن، زماني فر، کامران. "روشي براي رفع چالشهاي محتواي کاوي وب هاي فارسي زبان".
http://www.irandoc.ac.ir/Data/E_J/vol4/shahidi.htm
27- طباطبايي، علاءالدين. "در دشواري هاي رايانه اي زبان فارسي". نشر دانش، 103.
28- عاصي، مصطفي. "نقش رايانه در ايجاد استانداردهاي زباني". فرهنگ. سال چهاردهم، شماره هاي اول – دوم،بهار – تابستان 1380.
29- عزيز محمدي، فاطمه، "بررسي برخي فرآيندهاي رايج قرض گيري در زبان فارسي". فصلنامه اطلاع رساني، دوره 18، شماره 3 و 4.
30- فتاحي، رحمت الله. "چالش هاي سازمان¬دهي منابع دانش در آغاز قرن بيست و يکم با نگاهي بر دانش فهرست¬نويسي در ايران" . فصلنامه کتاب. 48.
31- فرهنگ تشريحي اصطلاحات کامپيوتري ميکروسافت. مترجم فرهاد قلي¬زاده نوري. تهران: کانون نشر علوم، 1379.
32- قاسمي، علي حسين، اطلاع يابي در اينترنت. تهران: چاپار، 1380.
33- کوشا، کيوان، ابزارهاي کاوش اينترنت : اصول، مهارتها و امکانات جستجو در وب . تهران: نشر کتابدار، 1381.
34- ---------- "معيارهاي ارزيابي ابزارهاي کاوش اينترنت : مطالعه مقايسه اي بر روي ابزارهاي کاوش وب با واسط جستجوي فارسي ".
http://www.ketabdar.org/magazine/detailarticle.asp?number=25
35- کوک، آليسون. راهنماي يافتن اطلاعات با کيفيت در اينترنت ،راهبردهاي گزينش و ارزيابي. ترجمه مهدي خادميان. مشهد: کتابخانه رايانه¬اي، 1382.
36- گزني، علي. "جست و جوي اطلاعات و ساز و کارهاي بهينه¬سازي آن". فصلنامه کتاب، 45.
37- گلاسبرنر، آلفرد. کليد طلايي جستجو در اينترنت. ترجمه رضا مجري، ليلا ملکان، عبدالله تباره . تهران: انتشارات خليج فارس، 1382.
38- محقق زاده، محمدصادق ؛ زارعيان، کاظم. " ارايه راه حل براي برخي مسايل اتوماسيون و نگارش فارسي" فصلنامه اطلاع رساني شماره 3و 4 دوره 19.
39- محمدي¬فرد،داود؛ آباقري، محمد. کامپيوتر براي کتابداران و اطلاع¬رسانان. تهران: چاپار، 1383.
40- مختاري نبي، ابراهيم." سازمان¬دهي منابع اينترنت: چالشها و ضرورتها ".
http://www.irandoc.ac.ir/data/E_J/vol1/organaizing.htm
41- مرتضايي، ليلا . "مسايل زبان و خط فارسي در ذخيره و بازيابي اطلاعات". فصلنامه اطلاع رساني. دوره 17. شماره 1 و 2 .
42- منصوريان، يزدان"عوامل موثر بر جستجو و بازيابي اطلاعات در شبکه جهانگستر وب" .http://www.ketabdar.org/magazine/detailarticle.asp?number=23
43- مينوي، مجتبي. مينوي بر گستره ادبيات فارسي. به کوشش ماه منير مينوي. تهران: توس، 1380.
44- "نگاهي به مشکلات خط فارسي در ارتباط با فناوري اطلاعات".
http://www.itna.ir/archives/report/001948.htm
45- نوتس، گري. راهبردها و شيوه هاي جستجو در اينترنت. ترجمه سيمين نيازي. فصلنامه کتاب،
46- نوروزي، علي رضا. "جستجو در اينترنت: آشنايي با موتور جستجوي گوگل". فصلنامه اطلاع رساني، دوره 16، شماره 3 و 4.
محمد صابر راثي ساربانقلي[2]
منبع: نما مجله الکترونيکي پژوهشگاه اطلاعات و مدارک علمي ايران آفتاب ارسال مقاله توسط کاربر محترم سايت :amirpetrucci0261