موتور جستجو (مثل گوگل) چگونه کار ميکند؟
وقتي جستجويي در يک موتور جستجو انجام و نتايج جستجو ارائه ميشود، کاربران در واقع نتيجه همکاري بخشهاي متفاوتي از آن را ميبينند. موتور جستجو قبلاً پايگاه داده خود را آماده کرده است و اينگونه نيست که درست در همان لحظه جستجو، تمام
طراحی وب سايت را بگردد تا پاسخي براي پرسش کاربر بيابد. بسياري از خود ميپرسند که چگونه امکان دارد گوگل در کمتر از يک ثانيه تمام سايتهاي وب را بگردد و ميليونها صفحه در خروجي خود ليست کند؟
درحقيقت گوگل و هر موتور جستجوي ديگري توانايي انجام چنين کاري را ندارد. همه آنها در زمان پاسخگويي به کاربران، تنها در پايگاه دادهاي که در اختيار دارند به جستجو ميپردازند و نه در همه وب!
موتور جستجو به کمک بخشهاي متفاوت خود و
طراحی وب سايت هاي اينترنتي اطلاعات مورد نياز را قبلاً جمعآوري، تجزيه و تحليل ميکند، آنها را در پايگاه دادهاش ذخيره مينمايد و به هنگام جستجوي کاربر، تنها در همين پايگاه داده ميگردد. موتور جستجو را ميتوان شامل سه بخش اصلي دانست که عبارتاند از:
جمعآوري کننده اطلاعات، اسپايدر
بايگانيکننده دادهها، ايندکسر
تحليلگر درخواست کاربر
الف ) جمع آوري کننده اطلاعات
جمع آوري کننده اطلاعات (اسپايدر، روبوت يا کراولر)، آن بخش از موتور جستجو است که کار جمعآوري اطلاعات مورد نياز آن را به عهده دارد. اسپايدر به صفحات مختلف سرميزند (فضولي کردن در وب)، محتواي آنها را ميخواند، اطلاعات مورد نياز را برای
طراحی وب سايت جمعآوري ميکند و در اختيار ساير بخشهاي موتور جستجو قرار ميدهد.
اسپايدر مشخص ميکند که کدام صفحات را مورد بازديد قرار دهد. در واقع تصميم ميگيرد که کدام يک از لينکهاي موجود در هر صفحه را دنبال کند. ممکن است همه لينکها را دنبال کند، برخي از آنها را و يا هيچ کدام را دنبال نکند. اسپايدر، ممکن است قبلاً به گونهاي برنامهريزي شده باشد که تنها صفحات خاصي از هر
طراحی وب سايت را ببيند.
دنبال کردن لينکهاي يک صفحه بستگي به ميزان تمايل و توانايي موتور جستجو در ذخيره اطلاعات يک سايت در پايگاه داده خود دارد. معمولاً موتورهاي جستجو دوست دارند صفحات مهم و مورد نياز کاربران را بايگاني کنند. اينگونه صفحات نيز در سايتهاي مهم و محبوب بيشتر ديده ميشود تا سايتهاي کمارزش. دقت کنيد که گفتم سايتهاي کمارزش و نه سايتهاي کوچک! سايت کوچک لزوماً کمارزش يا بيارزش نيست. بعداً خواهيد آموخت که چگونه سايت خود را مهم جلوه دهيد حتي اگر تنها يک صفحه
طراحی وب سايت داشته باشد! در واقع بسياري از سايتها نادانسته خود را بسيار کمتر از آن چه که واقعاً هستند، نشان ميدهند!
همچنين ممکن است اجازه مرور و خواندن محتواي بعضي از صفحات به موتورهاي جستجو داده نشده باشد. شما به عنوان دارنده سايت، همانطور که دوست داريد موتورهاي جستجو اطلاعات سايت شما را با خود ببرند، ميتوانيد آنها را از بعضي صفحات سايتتان دور کنيد و اجازه خواندن و بايگاني کردن محتواي آن صفحات را ندهيد. موتور جستجو اگر مؤدب باشد؛ قبل از ورود به هر سايتي ابتدا قوانين دسترسي به محتواي آن را بررسي ميکند و از حقوق دسترسي خود اطلاع مييابد.
تنظيم ميزان دسترسي موتورهاي جستجو به محتواي يک
طراحی وب سايت توسط پروتکل و طراحي سايت و دستوراتي خاص انجام ميشود که در بخشهاي بعد بررسي شده است.
کار اسپايدر، بسيار شبيه کار کاربران وب است. همانگونه که کاربران، صفحات مختلف را بازديد ميکنند، اسپايدر هم درست همين کار را انجام ميدهد، با اين تفاوت که اسپايدر کدهاي سازنده صفحات و کاربران نتيجه حاصل از کنار هم قرار گرفتن اين کدها را ميبينند.
page1.html، صفحهاي است که کاربران آن را به شکل زير ميبينند:
نمونهاي از صفحات وب که توسط مرورگرها نشان داده مي شود.
اما اسپايدر آن را چگونه ميبيند؟
براي اين که شما هم بتوانيد دنياي وب را از ديدگاه يک اسپايدر ببينيد، کافي است که کدهاي سازنده صفحات را مشاهده کنيد. براي اين کار در مرورگر خود، مسير نشان داده شده زير را دنبال کنيد:
Firefox: View > Page Source (Ctrl+U)
IE: Page > View Source (Ctrl+S)
فراموش نکنيد شما بايد توانايي کار با هر دو مرورگر فايرفاکس و اينترنت اکسپلورر را به خوبي بدانيد و سايت خود را در هر دو مرورگر اشاره شده بازديد و بررسي کنيد تا سايت براي اغلب کاربران وب ظاهر مناسبي داشته باشد.
کدهاي اچتيامال صفحه page1.html به صورت زير است:
کدهاي اچتيامال يک صفحه وب
آيا اين دنياي متني براي شما جذاب است؟
رد پاي اسپايدر به هنگام مشاهده صفحات يک سايت روي سرور آن ميماند. شما اگر اجازه دسترسي به آمار ديد و بازديدهاي صورت گرفته از يک
طراحی وب سايت و اتفاقات انجامشده در آن را داشته باشيد، ميتوانيد مشخص کنيد که اسپايدر کدام يک از موتورهاي جستجو صفحات سايت را مورد بازديد قرار داده است.
يکي از فعاليتهاي مهمي که در بازاريابي با موتورهاي جستجو انجام ميشود، تحليل همين ديد و بازديدهاست. در بخشهاي آتي کتاب به موضوع تحليل آمار سايت پرداخته شده است.
ب) بايگاني کننده دادهها
تمام اطلاعات جمعآوري شده توسط اسپايدر در اختيار ايندکسر قرار ميگيرد. در اين بخش اطلاعات ارسالي مورد تجزيه و تحليل قرار ميگيرند و به تکههاي متفاوتي تقسيم ميشوند. تجزيه و تحليل به اين معناست که مشخص ميشود اطلاعات از کدام صفحه ارسال شده است، چه حجمي دارد، کلمات موجود در آن کداماند، کلمات چندبار تکرار شدهاند و در کجاي صفحه قرار دارند، صفحه چه زماني بروز رساني شده است و…
در حقيقت ايندکسر، صفحه را به پارامترهاي آن خرد ميکند و تمام اين پارامترها را به يک مقياس عددي تبديل ميکند تا سيستم رتبهبندي بتواند پارامترهاي صفحات
طراحی وب سايت مختلف را با هم مقايسه کند. تمام دادهها تجزيه و تحليل شده، گروهبندي، کدگذاري و ذخيره ميشوند. همچنين دادهها قبل از آن که ذخيره شوند، طبق تکنيکهاي خاصي فشرده ميشوند تا حجم کمي را اشغال کند.
يک موتور جستجو بايد پايگاه داده عظيمي داشته باشد و به طور مداوم حجم محتواي آن را گسترش دهد. بزرگي و بروز بودن پايگاه داده يک موتور جستجو براي آن امتياز محسوب ميگردد.
حجم پايگاه داده موتورهاي جستجو و روش ذخيرهسازي دادهها در آن، متفاوت است. زماني رقابت شديدي در اعلام بزرگي پايگاه داده ميان موتورهاي جستجو وجود داشت. بعد از آن که گوگل ديگر به ارائه آمار پايگاه دادهاش ادامه نداد، عملاً رقابت به جبهههاي ديگري منتقل شد. هر چند بزرگي پايگاه داده امتياز محسوب ميشود اما به نظر ميرسد کيفيت در ارائه نتايج جستجو همچنان موردتوجهترين فاکتور براي رقابت است.
ج) تحليلگر درخواست کاربر
پس از انجام تمامي مراحل
طراحی وب سايت گفته شده، موتور جستجو آماده پاسخگويي به کاربران است. آنها چند کلمه را در فيلد جستجو وارد ميکنند و سپس با فشردن دکمه جستجو، منتظر پــاسخ موتور جستجو ميمانند. براي پاسخگويي به درخواست کاربر، ابتدا تمامي صفحات مرتبط موجود در پايگاه داده، مشخص ميشوند. پس از آن عمل رتبهبندي صورت ميگيرد. به عبارت ديگر صفحات جمعآوري شده، از بيشترين ارتباط تا کمترين ارتباط با موضوع مطرح شده، به عنوان نتايج جستجو به کاربر نشان داده ميشوند.
حتي اگر موتور جستجو بهترين و کاملترين پايگاه داده را داشته باشد اما نتواند پاسخهاي مرتبطي ارائه کند، يک موتور جستجوي ضعيف بهشمار ميآيد. آلتاويستا زماني مهمترين موتور جستجو در وب بود اما تنها به همين دليل بازي را به گوگلِ تازهوارد باخت. در حقيقت سيستم رتبهبندي قلب تپنده يک موتور جستجو است. تفاوت اصلي موتورهاي جستجو نيز در سيستم رتبهبندي ميباشد.
سيستم رتبهبندي براي پاسخگويي به سؤالات کاربران، پارامترهاي بسياري را در نظر ميگيرد تا بتواند بهترين پاسخها را در اختيار آنها قرار دهد. به اين سيستم رتبهبندي، الگوريتم گفته ميشود. الگوريتم، مجموعهاي از دستورالعملهاست که موتور جستجو با اعمال
طراحی وب سايت آنها بر پارامترهاي صفحات موجود در پايگاه دادهاش، تصميم ميگيرد که صفحات مرتبط را چگونه در نتايج جستجو مرتب کند.
در حال حاضر قدرتمندترين سيستم رتبهبندي را گوگل در اختيار دارد. سيستم رتبهبندي گوگل پيجرنک نام دارد که در بخشهاي آتي کتاب معرفي شده است.
به طور خلاصه ميتوانيم فعاليت موتور جستجو را در سه مورد زير بگنجانيم:
مراجعه به صفحات و خواندن محتواي آنها
بايگاني اطلاعات خوانده شده
رتبهبندي صفحات متناسب با کلمات جستجو شده
طراحی وب سایت...
ما را در سایت طراحی وب سایت دنبال می کنید
برچسب : طراحی سایت, نویسنده : سورنا webdesign8 بازدید : 145 تاريخ : سه شنبه 24 بهمن 1391 ساعت: 20:59