مقایسه موتور های جستجو
یک شنبه 23 آذر 1393 12:59 PM
از آنجايي كه اين روزها تعداد موتورهاي جست و جو روبه افزايش است، كاربران بهتر است براي جست وجو و انتخاب درست، امكانات و ويژگيهاي اين موتورها را بدانند. براين اساس نويسنده در نوشتار حاضر بر آن است تا بانكهاي اطلاعاتي موتورهاي جست وجو را مورد بررسي قرار داده، حجم و دامنهي دادههاي آنها، هم پوشي ميان اطلاعات موجود در موتورها و تغييرات دادههاي آنها در طي زمان را براي خوانندگان بازگو كند.
موتورهاي جست وجويي مانند AltaVista, Northern Light, Excite و Infoseek هر كدام بانكهاي اطلاعاتي مجزايي دارند. اين بانكهاي اطلاعاتي عظيم كه هر كدام شامل ميليونها صفحهي پر از فهرست صفحههاي وب بوده، تنها بخشي از اطلاعات موجود در اينترنت هستند.
افزون بر اين، هر كدام از موتورهاي جست وجو امكانات بسيار متنوعي براي جست وجو دارند كه ممكن است فراتر از آنچه باشد كه كاربران انتظار دارند. در اين مقاله برخي از ويژگيهاي ناآشنا و يا به ظاهر عجيب موتورهاي جست و جو نشان داده خواهد شد.
موتورهاي جست وجوي اينترنت برخي از بزرگترين و پر مصرفترين موتورها در دنياي وسيع اينترنت هستند. بانكهاي اطلاعاتي عظيم از ميليونها صفحه تشكيل شدهاند.
كاربراني كه براي پرسشهاي مورد نظر خود جست و جو ميكنند انتظار دارند كه تمامي صفحههايي كه واژهي مورد نظر آنان در آن به كار رفته به آنان نشان داده شود. متاسفانه، موتورهاي جست و جو و بانكهاي اطلاعاتي آنها اين كار را انجام نميدهد. آنها تنها ميتوانند برخي از صفحههايي كه شامل واژههاي مورد نظر كاربران هستند را يافته و گاهي برخي از صفحههايي كه از نظر محتوي، مرتبط با آن واژه هستند را نيز در ميان نتايج جست وجو براي كاربران نمايش ميدهند.
دانستن اين واقعيتها داراي اهميت است و درك بيشتر از دامنهي اطلاعات، محدوديتها و هم پوشي ميان صفحههاي بانكهاي اطلاعاتي عظيم ميتواند بسيار مفيد باشد.
حجم و دامنهي اطلاعات
شركتهاي موتورهاي جست و جوي گوناگون از سالها پيش در مورد حجم وسيع اطلاعات خود و ميليونها صفحه از فهرستهاي موجود در بانكهاي اطلاعاتي خود صحبت كردهاند. AltaVista, Lycos, HotBot و بسياري از شركتهاي ديگر با شادي و غرور تعداد كل صفحههاي بانكهاي اطلاعاتي خود را اعلام كردهاند.
اگرچه، آنان شيوههاي گوناگوني براي محاسبه دارند و حجم كل بانكهاي اطلاعاتي را نميتوان به سادگي تعيين كرد.
از نظر جست وجو كنندگان، نتيجه مهم است. بنابراين امكان دارد شركتهايي كه دامنهي بانكهاي اطلاعاتي آنها كوچكتر است نيز بتوانند به دليل به دست دادن نتايج بهتر، نظر كاربران را جلب كنند.
براي اين كه بتوان مقايسهي منصفانهيي در اين ميان انجام داد، واژههاي جست وجو بايد به يك شيوه در موتورهاي مورد بررسي پردازش شوند. به عنوان مثال اسمهاي مفردي كه صورت جمع ندارند بهتر هستند، چراكه برخي از موتورهاي جست وجو خود به خود گونههاي مختلف يك واژه را به عنوان نتيجهي جست و جو در اختيار كاربر قرار ميدهند. براي انجام اين مقايسه عبارتهاي خاص نيز مناسب هستند.
بايد به اين نكته نيز توجه كرد كه تمامي موتورهاي جست وجو آن تعداد نتيجهيي را كه ادعا ميكنند، نميتوانند براي كاربران پيدا كنند. به اين منظور در آگوست 1998 محققان 15 واژه و عبارت را در موتورهاي جست وجوي زير وارد كردند. اين موتورها عبارت بودند از Northern Light, Excite, HotBot, AltaVista, Infoseek, Lycos و WebCrawler.
از ميان موتورهاي مورد بررسي AltaVista, Northern Light, و HotBot بيشترين نتيجه را يافتهاند.
پس از مقايسهي موتورهاي يادشده و تعيين حجم آنها محققان به اين نكته اشاره كردهاند كه در هنگام استفاده از موتورهاي جست و جو دانستن حجم بانكهاي اطلاعاتي موتورهاي جست وجو بسيار مفيد خواهد بود.
همپوشي
براي يافتن مقدار هم پوشي ميان موتورهاي جست وجو، مقايسهيي مشابه با آنچه در قسمت پيش بازگو شد، انجام شده است. محققان پس از بررسي موتورهاي جست و جوي برتر به اين نتيجهي شگفت انگيز دست يافتند كه در بانكهاي اطلاعاتي اين موتورهاي جست وجو هم پوشي اندكي وجود دارد. در 4 جست وجو كه در پنج موتور جست وجوي معروف صورت گرفته از ميان نتايج به دست آمده، تنها بخش اندكي تكراري بوده است.
در يكي از بررسيهايي كه در اين زمينه انجام شده، نتايج به دست آمده از جست وجوي واژهيي در پنج موتور جست وجو 103 مورد بوده است. از ميان 103 نتيجهي به دست آمده، 70 صفحه تكراري نبوده است. حتي يك صفحه از آن 70 صفحه را موتورهاي ديگر پيدا نكردهاند. نكتهي قابل توجه اين كه تنها 3 صفحه از نتايج جست وجو توسط هر پنج موتور پيدا شده است.
مقايسههايي كه بيش از اين صورت گرفته نيز نتايج مشابهي را نشان ميدهد. در اكتبر 1997 چهار جست وجو در موتورهاي Northern Light, Excite, HotBot و AltaVista انجام شده كه در مجموع 400 نتيجه را نشان داده است. گفتني آن كه از اين ميان 220 نتيجه تكراري نبودهاند. از ميان تمامي نتايج تنها 12 مورد را هر چهار موتور جست و جو نشان دادهاند.
لورنس و گيلز با انجام آزمايشي مشابه اما در مقياسي وسيعتر در دسامبر 1997 نتايج مشابهي به دست آوردهاند. آنان اين بررسي را با استفاده از 575 واژه و عبارت انجام دادهاند.
به باور كارشناسان با در نظر گرفتن ميزان هم پوشي اندك در بانكهاي اطلاعاتي موتورهاي جست وجو، كاربران هنگامي كه براي يافتن اطلاعات مورد نظر خود تنها از يك موتور جست وجو استفاده ميكنند بايد از اين امر با خبر بوده و آگاهانه عمل كنند. شايد بهتر آن باشد كه براي رسيدن به نتايج بهتر، از چند موتور جست وجو استفاده شود.
تغيير در طول زمان
در بررسي بانكهاي اطلاعاتي و مقايسهي آنها نكتهي جالب و شايد غير عادي تغيير حجم در زمانهاي مختلف بوده است. شبكه با سرعت خارقالعادهيي رو به رشد است. بسياري از صفحههاي شبكه كه بايست سالها پيش از شبكه حذف ميشدند همچنان در بانكهاي اطلاعاتي موتورهاي جست وجو موجود هستند. بررسيهاي انجام شده و مقايسهي بانكهاي اطلاعاتي موتورهاي جست وجو حاكي از آن است كه هنوز اين منابع عظيم به سرعت حركت شبكه پيش نميروند.
وجود صفحههاي قديمي كه بايد پيش از اين حذف شده باشد در يافتن نتايج مداخله كرده و به باور كارشناسان كاربران براي رسيدن به نتايج بهتر، بايد در بيش از يك موتور جست وجو، جست وجوي خود را انجام دهند.
امكانات جست وجو
امكانات و قابليتهاي جست وجو در ميان موتورهاي گوناگون، متفاوت است. همچنين آنها با گذشت زمان تغيير كرده و امكانات جديدي را در دسترس كاربران قرار ميدهند. به عنوان مثال در گذشته جست وجوي بولي در دسترس نبود. (جست وجوي بانك اطلاعاتي كه از عمليات بولي استفاده ميكند. چهار عملگر بولي رايج عبارتند از and, or, xor و not) اكنون تمامي موتورهاي جست وجو شامل اين عملگرها هستند.
امكان جست و جو براي يك عبارت و استفاده از گيومه در دو طرف عبارت به اين معني كه تنها همان عبارت خاص در نتايج نشان داده شود، در تمامي موتورهاي جست وجو وجود دارد.
شناختن امكانات هر موتور جست وجو ميتواند به كاربران كمك كند كه اطلاعات مورد نياز خود را راحتتر به دست آورند.
به اين نكته نيز بايد اشاره كرد كه بررسي نشان داده است كه هميشه امكانات مطابق با انتظار كار نميكنند. برخي از نتايجي كه به كاربر نشان داده ميشود فاقد كلمهي جست وجو، يعني همان كلمهيي كه كاربر وارد كرده، است. همچنين تعداد نتيجهيي كه براي يك عبارت يا كلمه نشان داده ميشود، هميشه برابر با تعداد همان عبارت يا واژه در بانكهاي اطلاعاتي نيست.
در نهايت بايد اشاره كرد، اگر چه در اين نوشتار برخي از ويژگيهاي عجيب و غريب و مشكلات موتورهاي جست وجو براي كاربران بازگو شده، اما بايد همواره به اين نكتهي مهم توجه داشت كه موتورهاي جست وجو ابزار مناسبي براي يافتن اطلاعات مورد نياز در شبكهي عظيم اينترنت هستند. با دانستن امكانات و برخي از محدوديتهاي موتورهاي جست وجو، محققان و كاربران ميتوانند نتايج بهتر و اطلاعات دقيقتري از شبكه به دست آورند.
ترکی زبان قربون صدقه رفتنه داریم که: گوزلرین گیلهسین قاداسین آلیم که یعنی درد و بلای مردمک چشات به جونم …!.