0

دقت موتورهای کاوش اینترنتی: مطالعه‌ای موردی در ارتباط با علوم زمین1

 
hasantaleb
hasantaleb
کاربر طلایی1
تاریخ عضویت : شهریور 1387 
تعداد پست ها : 58933
محل سکونت : اصفهان

دقت موتورهای کاوش اینترنتی: مطالعه‌ای موردی در ارتباط با علوم زمین1
شنبه 2 بهمن 1389  5:24 PM

دقت موتورهای کاوش اینترنتی: مطالعه‌ای موردی در ارتباط با علوم زمین

مقدمه
اطلاعات علوم زمین بصورت گسترده‌ای از طریق مؤسسات و شركتهای دولتی، ملی، منطقه‌ای و بین‌المللی و نیز منابع متعدد تجاری و شخصی بر روی اینترنت موجود می‌باشند. برخی از مؤسسات نظیر سازمان زمین‌شناسی ایالات متحده و سازمان جهانی هواشناسی، سایت وب‌های خود را با ابزارهای جستجو برای یافتن اطلاعات در سایت، اداره می‌نمایند. بدین ترتیب به منظور آگاهی از اینكه جستجوگر یا گروه جستجو با چه كسی مشاركت دارد یا اینكه مؤسسات دربارهء چه موضوع ویژه‌ای تحقیق می‌كنند، استفاده از یك موتور كاوش ضروری می‌نماید. این مقاله نتایج پرسشهای نمونه مرتبط با علوم زمین را در ۳۷ موتور جستجوی مبتنی بر وب ارائه می‌نماید.

اطلاعات بر مبنای اندازه بانك اطلاعاتی، دسترس‌پذیری اطلاعات علوم زمین و نیز ارزیابی دقت موتور كاوش بر مبنای سه نمونه پرسش، ارائه می‌گردد.بخش اول مقاله شرح مختصری از ساختار موتورهای كاوش را بدست می‌دهد. بخش دوم روش‌شناسی بكار رفته در ارزیابی موتورهای كاوش را ارائه می‌نماید. بخش سوم، نتایج حاصل از كاوشهای نمونه برای بررسی می‌نماید و شامل جدولی است كه اطلاعات ارزیابی شده را تنظیم می‌كند و راهكارهایی را كه می‌تواند در بدست آوردن اطلاعات علوم زمین هنگام استفاده از موتورهای كاوش اینترنتی مفید باشد، مورد بررسی قرار می‌دهد.


۱- ساختار موتور كاوش


موتورهای كاوش وبی همانند یك فهرست، جستجوگران را به یافتن اصطلاحات مورد كاوش هدایت می‌نمایند. به هر حال موتورهای جستجو مبتنی بر وب، واژه‌های موجود در متن یا پایگاه اطلاعاتی كنترل شده را نشان نمی‌دهند و بیشتر به رویدادهای اینترنتی اشاره دارند. به دلیل پیچیدگی فضای وب، مقایسه موتورهای كاوش كار دشواری است.


موتورهای كاوش در سه ردهء اصلی گسترش یافته‌اند. ردهء اول شامل موتورهای كاوش فهرستی یا راهنما۸ می‌باشد كه براساس موضوع یا نوع مدرك تنظیم شده‌اند. نمونه‌هایی از آنها عبارتند از:


یاهو! ۹ (یك فهرست مبتنی بر موضوع با یك وسیلهء كمكی كاوش كلیدواژه‌ای)، آرگوس كلیرینگهاوس (مجموعه‌ای از موتورهای جستجوی مبتنی بر موضوع)، دجانیوز۱۰ (یك موتور جستجوی اختصاص داده شده به اطلاعات یوزنت)، و ماژلان۱۱ (یك فهرست مبتنی بر موضوع از سایت وب‌های بازبینی شده).ردهء دوم عبارتند از: موتورهای جستجوی كلیدواژه‌ای یا روبات خزنده (نرم‌افزاری) ۱۲. این موتورها عناصر اینترنتی تهیه شده توسط برنامه‌های روباتی یا عنكبوتی را فهرست می‌نمایند. این برنامه‌ها مرتباً به منظور تأمین اطلاعات جدید و روزآمد، از طریق داده‌ها، پیوندها و متن صفحات وبی، هدایت می‌شوند. نمونه‌هایی از روبات‌های خزنده عبارتند از: هات بات۱۳، كه برنامه‌ای را بكار می‌برد كه صفحات وب را كلمه به كلمه فهرست می‌كند. اینفوسیك كه اطلاعات را از بین فرامین داده‌ها و پیوندها انتخاب می‌نماید.ردهء سوم موتورهای كاوش عبارتند از: موتورهای كاوش چندشاخه‌ای یا چند روباتی (متاكرولر) ۱۴، كه پایگاههای اطلاعاتی موتورهای كاوش متعددی را به طور همزمان جستجو می‌كند و نتایج تلفیقی را ارائه می‌نماید.


نمونه‌هایی از آن عبارتند از: متاكرولر۱۵ كه كلیدواژه‌ها را برای جستجوی شش فهرست بطور همزمان بكار می‌برد و آسك جیوز۱۶ كه پرسش‌های زبان طبیعی و یك سیستم تخصصی را برای جستجوی پنج موتور كاوش كلیدواژه‌ای بطور همزمان، بكار می‌برد.


در سه ردهء اصلی موتورهای كاوش، فناوریهای متقاطع وجود دارد. بعنوان مثال، برخی از موتورهای كاوش فهرستی یا راهنما دارای فهرستهای قابل جستجوی كلیدواژه‌ای و نیز درختهای موضوعی قابل مرور می‌باشند (نظیر: یاهو!، گالاكسی۱۷ و اینترنت اسلوث۱۸). همچنین برخی موتورهای كاوش كلیدواژه‌ای یا روبات خزنده، كانالهای موضوعی سلسله مراتبی به مدرك را در پایگاههای اطلاعاتی‌شان فراهم می‌كنند، مانند: اكسایت، لایكوس۱۹ و اینفوسیك.


به منظور بدست آوردن مناسبترین و دقیقترین نتایج، جستجوگران باید از برخی معیارهای مهم آگاه باشند. پیوندهای «كمكی»، «نحوهء جستجو» یا «درباره» روی صفحهء اصلی موتور كاوش به پاسخ دادن به این سؤالات كمك می‌نمایند:


۱- پایگاه اطلاعاتی چگونه ایجاد می‌شود؟ برخی موتورهای كاوش برای ثبت سایتهای خود به طراحان صفحهء وب متكی هستند، و برخی دیگر برای اطلاعات متمركز و روزآمد به بخشهای خزندهء وب، وابسته می‌باشند. در مقابل روبات خزنده تنها دستورات و فراپیوندها را جستجو نموده یا اصولاً متن صفحات را مرور می‌نماید.


۲- بزرگی پایگاه اطلاعاتی چقدر است؟ اندازهء پایگاه اطلاعاتی در بازیابی و دقت یك جستجو، مؤثر خواهد بود. برخی موتورهای كاوش نظیر یاهو و بیشتر سایتهای فهرستی، تنها صفحات اصلی اولیه را منظور می‌كنند، اما در عمل صفحات بیشتری را فهرست می‌نمایند. موتورهای دیگر هر صفحه را منظور می‌نمایند.


۳- پایگاه اطلاعاتی چقدر به روز است؟ و هر چند وقت یك بار روزآمد می‌شود؟ برنامه‌ریزان، روباتهای خزنده‌ای را طراحی نموده‌اند كه بصورت خودكار طبق یك برنامهء منظم كار می‌نماید. فاصلهء زمانی بین افزایش اطلاعات جدید و ورود آن به موتور كاوش حائز اهمیت است، خصوصاً اگر موضوع جستجو بسیار روزآمد باشد.


۴- چه عوامل جستجویی، موتور را حمایت می‌نمایند؟ برخی، امكانات جستجوی پیچیده از قبیل منطق بولی، جستجوی عبارتی و تقریب را پیشنهاد می‌نمایند، در حالیكه برخی دیگر چنین نمی‌كنند. یكی از مشكلات اصلی در استفاده از موتورهای كاوش مبتنی بر وب، ناتوانی در جستجوی فیلدهایی نظیر نویسنده یا عنوان می‌باشد، ضمناً برخی موتورهای كاوش به جستجوگران امكان تلفیق مجموعه نتایج را نمی‌دهد.


۵- نتایج جستجو چگونه مرتب شده و نمایش داده می‌شود؟ برخی موتورها نظیر اكسایت كه جستجوی مبتنی بر مفهوم را به كار می‌برند، نتایج جستجو را نه تنها برای واژه‌های مشخص بلكه برای مفاهیم مربوطه نیز ارائه می‌نمایند. برخی موتورها مانند هات بات نتایج را برمبنای تعداد دفعات موجود بودن واژه مورد جستجو روی یك صفحه ارائه می‌نمایند. برخی موتورهای كاوش تنها فراپیوندهای نتایج مرتب شده را فهرست می‌نمایند. نتایجی كه دیگر موتورهای كاوش ارائه می‌نمایند عبارتند از: چكیده یا شرح مختصر، اندازهء صفحه، پیوندهای مرتبط، نتایج فهرست‌نویسی، معرفی یا اطلاعات مربوط به نویسنده.


اگرچه یك زبان فرمان مشترك برای گسترش ارتباط وجود دارد، لكن هنوز تفاوتهای زیادی به چشم می‌خورد. برای كنترل بیشتر اطلاع‌یابی و نتایج حاصله، جستجوگران باید حداكثر استفاده را از امكانات جستجوی «قوی»۲۰ یا «پیشرفته»۲۱ موتورهای مختلف را بنمایند. سه نمونه سایت وب كه مقایسه‌های جالبی بین موتورهای كاوش اصلی انجام می‌دهند عبارتند از: وب ماتریكس۲۲ تهیه شده توسط‌«مات اسلات»


http://janus.ambrosiasw.com/~fprefect/matrix/


[Note:Link moved; URL changed ۴/۲/۰۲ by ald]


موتورهای كاوش واچ وب سایت۲۳


( http://searchenginewatch.com /)


و موتورهای كاوش :C&#۶۱۶۷۹;Net’s كه هرچیز را بر روی شبكه جستجو می‌نمایند (تهیه شده توسط آندره جی. لئونارد)


http://www.cnet.com/Content/Reviews/Compare/Search/index.hml )


[Note: Broken link removed ۸/۵/۹۸ by ald]


این سایت وب‌ها دارای جداولی می‌باشند كه در آنها توانائی‌ها، اندازه و رواج موتورهای كاوش اصلی با یكدیگر مقایسه می‌گردد. برای فهرستهای كامل موتورهای كاوش، از سایت وب مؤسسه فناوری حرفه‌ای دانشگاه كارولینای شمالی


( http://www.it.unc.edu/guides/irg-۰۸.html )


[Note: Broken link removed ۳/۴/۰۱ by ald]


و نیز فهرست موتورهای كاوش یاهو بازدید كنید.


http://dir/yahoo.com/computers_and_internet/internet/world_wide_web/searching_the_web/ ).


[Note: Link moved;URL changed ۷/۲۴/۰۰ by ald]

عالم محضر خداست درمحضر خدا گناه نکنید حضرت امام (ره)

تشکرات از این پست
دسترسی سریع به انجمن ها