دقت موتورهای کاوش اینترنتی: مطالعهای موردی در ارتباط با علوم زمین
مقدمه
اطلاعات علوم زمین بصورت گستردهای از طریق مؤسسات و شركتهای دولتی، ملی، منطقهای و بینالمللی و نیز منابع متعدد تجاری و شخصی بر روی اینترنت موجود میباشند. برخی از مؤسسات نظیر سازمان زمینشناسی ایالات متحده و سازمان جهانی هواشناسی، سایت وبهای خود را با ابزارهای جستجو برای یافتن اطلاعات در سایت، اداره مینمایند. بدین ترتیب به منظور آگاهی از اینكه جستجوگر یا گروه جستجو با چه كسی مشاركت دارد یا اینكه مؤسسات دربارهء چه موضوع ویژهای تحقیق میكنند، استفاده از یك موتور كاوش ضروری مینماید. این مقاله نتایج پرسشهای نمونه مرتبط با علوم زمین را در ۳۷ موتور جستجوی مبتنی بر وب ارائه مینماید.
اطلاعات بر مبنای اندازه بانك اطلاعاتی، دسترسپذیری اطلاعات علوم زمین و نیز ارزیابی دقت موتور كاوش بر مبنای سه نمونه پرسش، ارائه میگردد.بخش اول مقاله شرح مختصری از ساختار موتورهای كاوش را بدست میدهد. بخش دوم روششناسی بكار رفته در ارزیابی موتورهای كاوش را ارائه مینماید. بخش سوم، نتایج حاصل از كاوشهای نمونه برای بررسی مینماید و شامل جدولی است كه اطلاعات ارزیابی شده را تنظیم میكند و راهكارهایی را كه میتواند در بدست آوردن اطلاعات علوم زمین هنگام استفاده از موتورهای كاوش اینترنتی مفید باشد، مورد بررسی قرار میدهد.
۱- ساختار موتور كاوش
موتورهای كاوش وبی همانند یك فهرست، جستجوگران را به یافتن اصطلاحات مورد كاوش هدایت مینمایند. به هر حال موتورهای جستجو مبتنی بر وب، واژههای موجود در متن یا پایگاه اطلاعاتی كنترل شده را نشان نمیدهند و بیشتر به رویدادهای اینترنتی اشاره دارند. به دلیل پیچیدگی فضای وب، مقایسه موتورهای كاوش كار دشواری است.
موتورهای كاوش در سه ردهء اصلی گسترش یافتهاند. ردهء اول شامل موتورهای كاوش فهرستی یا راهنما۸ میباشد كه براساس موضوع یا نوع مدرك تنظیم شدهاند. نمونههایی از آنها عبارتند از:
یاهو! ۹ (یك فهرست مبتنی بر موضوع با یك وسیلهء كمكی كاوش كلیدواژهای)، آرگوس كلیرینگهاوس (مجموعهای از موتورهای جستجوی مبتنی بر موضوع)، دجانیوز۱۰ (یك موتور جستجوی اختصاص داده شده به اطلاعات یوزنت)، و ماژلان۱۱ (یك فهرست مبتنی بر موضوع از سایت وبهای بازبینی شده).ردهء دوم عبارتند از: موتورهای جستجوی كلیدواژهای یا روبات خزنده (نرمافزاری) ۱۲. این موتورها عناصر اینترنتی تهیه شده توسط برنامههای روباتی یا عنكبوتی را فهرست مینمایند. این برنامهها مرتباً به منظور تأمین اطلاعات جدید و روزآمد، از طریق دادهها، پیوندها و متن صفحات وبی، هدایت میشوند. نمونههایی از روباتهای خزنده عبارتند از: هات بات۱۳، كه برنامهای را بكار میبرد كه صفحات وب را كلمه به كلمه فهرست میكند. اینفوسیك كه اطلاعات را از بین فرامین دادهها و پیوندها انتخاب مینماید.ردهء سوم موتورهای كاوش عبارتند از: موتورهای كاوش چندشاخهای یا چند روباتی (متاكرولر) ۱۴، كه پایگاههای اطلاعاتی موتورهای كاوش متعددی را به طور همزمان جستجو میكند و نتایج تلفیقی را ارائه مینماید.
نمونههایی از آن عبارتند از: متاكرولر۱۵ كه كلیدواژهها را برای جستجوی شش فهرست بطور همزمان بكار میبرد و آسك جیوز۱۶ كه پرسشهای زبان طبیعی و یك سیستم تخصصی را برای جستجوی پنج موتور كاوش كلیدواژهای بطور همزمان، بكار میبرد.
در سه ردهء اصلی موتورهای كاوش، فناوریهای متقاطع وجود دارد. بعنوان مثال، برخی از موتورهای كاوش فهرستی یا راهنما دارای فهرستهای قابل جستجوی كلیدواژهای و نیز درختهای موضوعی قابل مرور میباشند (نظیر: یاهو!، گالاكسی۱۷ و اینترنت اسلوث۱۸). همچنین برخی موتورهای كاوش كلیدواژهای یا روبات خزنده، كانالهای موضوعی سلسله مراتبی به مدرك را در پایگاههای اطلاعاتیشان فراهم میكنند، مانند: اكسایت، لایكوس۱۹ و اینفوسیك.
به منظور بدست آوردن مناسبترین و دقیقترین نتایج، جستجوگران باید از برخی معیارهای مهم آگاه باشند. پیوندهای «كمكی»، «نحوهء جستجو» یا «درباره» روی صفحهء اصلی موتور كاوش به پاسخ دادن به این سؤالات كمك مینمایند:
۱- پایگاه اطلاعاتی چگونه ایجاد میشود؟ برخی موتورهای كاوش برای ثبت سایتهای خود به طراحان صفحهء وب متكی هستند، و برخی دیگر برای اطلاعات متمركز و روزآمد به بخشهای خزندهء وب، وابسته میباشند. در مقابل روبات خزنده تنها دستورات و فراپیوندها را جستجو نموده یا اصولاً متن صفحات را مرور مینماید.
۲- بزرگی پایگاه اطلاعاتی چقدر است؟ اندازهء پایگاه اطلاعاتی در بازیابی و دقت یك جستجو، مؤثر خواهد بود. برخی موتورهای كاوش نظیر یاهو و بیشتر سایتهای فهرستی، تنها صفحات اصلی اولیه را منظور میكنند، اما در عمل صفحات بیشتری را فهرست مینمایند. موتورهای دیگر هر صفحه را منظور مینمایند.
۳- پایگاه اطلاعاتی چقدر به روز است؟ و هر چند وقت یك بار روزآمد میشود؟ برنامهریزان، روباتهای خزندهای را طراحی نمودهاند كه بصورت خودكار طبق یك برنامهء منظم كار مینماید. فاصلهء زمانی بین افزایش اطلاعات جدید و ورود آن به موتور كاوش حائز اهمیت است، خصوصاً اگر موضوع جستجو بسیار روزآمد باشد.
۴- چه عوامل جستجویی، موتور را حمایت مینمایند؟ برخی، امكانات جستجوی پیچیده از قبیل منطق بولی، جستجوی عبارتی و تقریب را پیشنهاد مینمایند، در حالیكه برخی دیگر چنین نمیكنند. یكی از مشكلات اصلی در استفاده از موتورهای كاوش مبتنی بر وب، ناتوانی در جستجوی فیلدهایی نظیر نویسنده یا عنوان میباشد، ضمناً برخی موتورهای كاوش به جستجوگران امكان تلفیق مجموعه نتایج را نمیدهد.
۵- نتایج جستجو چگونه مرتب شده و نمایش داده میشود؟ برخی موتورها نظیر اكسایت كه جستجوی مبتنی بر مفهوم را به كار میبرند، نتایج جستجو را نه تنها برای واژههای مشخص بلكه برای مفاهیم مربوطه نیز ارائه مینمایند. برخی موتورها مانند هات بات نتایج را برمبنای تعداد دفعات موجود بودن واژه مورد جستجو روی یك صفحه ارائه مینمایند. برخی موتورهای كاوش تنها فراپیوندهای نتایج مرتب شده را فهرست مینمایند. نتایجی كه دیگر موتورهای كاوش ارائه مینمایند عبارتند از: چكیده یا شرح مختصر، اندازهء صفحه، پیوندهای مرتبط، نتایج فهرستنویسی، معرفی یا اطلاعات مربوط به نویسنده.
اگرچه یك زبان فرمان مشترك برای گسترش ارتباط وجود دارد، لكن هنوز تفاوتهای زیادی به چشم میخورد. برای كنترل بیشتر اطلاعیابی و نتایج حاصله، جستجوگران باید حداكثر استفاده را از امكانات جستجوی «قوی»۲۰ یا «پیشرفته»۲۱ موتورهای مختلف را بنمایند. سه نمونه سایت وب كه مقایسههای جالبی بین موتورهای كاوش اصلی انجام میدهند عبارتند از: وب ماتریكس۲۲ تهیه شده توسط«مات اسلات»
http://janus.ambrosiasw.com/~fprefect/matrix/
[Note:Link moved; URL changed ۴/۲/۰۲ by ald]
موتورهای كاوش واچ وب سایت۲۳
( http://searchenginewatch.com /)
و موتورهای كاوش :C&#۶۱۶۷۹;Net’s كه هرچیز را بر روی شبكه جستجو مینمایند (تهیه شده توسط آندره جی. لئونارد)
http://www.cnet.com/Content/Reviews/Compare/Search/index.hml )
[Note: Broken link removed ۸/۵/۹۸ by ald]
این سایت وبها دارای جداولی میباشند كه در آنها توانائیها، اندازه و رواج موتورهای كاوش اصلی با یكدیگر مقایسه میگردد. برای فهرستهای كامل موتورهای كاوش، از سایت وب مؤسسه فناوری حرفهای دانشگاه كارولینای شمالی
( http://www.it.unc.edu/guides/irg-۰۸.html )
[Note: Broken link removed ۳/۴/۰۱ by ald]
و نیز فهرست موتورهای كاوش یاهو بازدید كنید.
http://dir/yahoo.com/computers_and_internet/internet/world_wide_web/searching_the_web/ ).
[Note: Link moved;URL changed ۷/۲۴/۰۰ by ald]