طراحی وب سایت

ساخت وبلاگ

 موتور جستجو (مثل گوگل) چگونه کار مي­کند؟

 
 
وقتي جستجويي در يک موتور جستجو انجام و نتايج جستجو ارائه مي­شود، کاربران در ­واقع نتيجه همکاري بخش­هاي متفاوتي از آن را مي­بينند. موتور جستجو قبلاً پايگاه داده خود را آماده کرده است و اين­گونه نيست که درست در همان لحظه جستجو، تمام طراحی وب سايت را بگردد تا پاسخي براي پرسش کاربر بيابد. بسياري از خود مي­پرسند که چگونه امکان دارد گوگل در کم‏تر از يک ثانيه تمام سايت­هاي وب را بگردد و ميليون­ها صفحه در خروجي خود ليست کند؟
 
در­حقيقت گوگل و هر موتور جستجوي ديگري توانايي انجام چنين کاري را ندارد. همه آن‏ها در زمان پاسخ­گويي به کاربران، تنها در پايگاه داده­اي که در اختيار دارند به جستجو مي­پردازند و نه در همه وب!
موتور جستجو به کمک بخش­هاي متفاوت خود و طراحی وب سايت هاي اينترنتي اطلاعات مورد نياز را قبلاً جمع­آوري، تجزيه و تحليل مي­کند، آن‏ها را در پايگاه داده­اش ذخيره مي­نمايد و به هنگام جستجوي کاربر، تنها در همين پايگاه داده مي­گردد. موتور جستجو را مي­توان شامل سه بخش اصلي دانست که عبارت­اند از:
جمع‏آوري کننده اطلاعات، اسپايدر
بايگاني­کننده داده­ها، ايندکسر
تحليل­گر درخواست کاربر
الف ) جمع ‏آوري کننده اطلاعات
جمع ‏آوري کننده اطلاعات (اسپايدر، روبوت يا کراولر)، آن بخش از موتور جستجو است که کار جمع‌آوري اطلاعات مورد نياز آن را به عهده دارد. اسپايدر به صفحات مختلف سر­مي­زند (فضولي کردن در وب)، محتواي آن‏ها را مي­خواند، اطلاعات مورد نياز را برای طراحی وب سايت جمع­آوري مي­کند و در اختيار ساير بخش­هاي موتور جستجو قرار مي­دهد.
اسپايدر مشخص مي­کند که کدام صفحات را مورد بازديد قرار دهد. در واقع تصميم مي­گيرد که کدام يک از لينک­هاي موجود در هر صفحه را دنبال کند. ممکن است همه لينک­ها را دنبال کند، برخي از آن‏ها را و يا هيچ کدام را دنبال نکند. اسپايدر، ممکن است قبلاً به گونه­اي برنامه­ريزي شده باشد که تنها صفحات خاصي از هر طراحی وب سايت را ببيند.
دنبال کردن لينک­هاي يک صفحه بستگي به ميزان تمايل و توانايي موتور جستجو در ذخيره اطلاعات يک سايت در پايگاه داده خود دارد. معمولاً موتورهاي جستجو دوست دارند صفحات مهم و مورد نياز کاربران را بايگاني کنند. اين­گونه صفحات نيز در سايت­هاي مهم و محبوب بيش‏تر ديده مي‏شود تا سايت­هاي کم­ارزش. دقت کنيد که گفتم سايت­هاي کم­ارزش و نه سايت­هاي کوچک! سايت کوچک لزوماً کم­ارزش يا بي­ارزش نيست. بعداً خواهيد آموخت که چگونه سايت خود را مهم جلوه دهيد حتي اگر تنها يک صفحه طراحی وب سايت داشته باشد! در واقع بسياري از سايت­ها نادانسته خود را بسيار کم‏تر از آن چه که واقعاً هستند، نشان مي­دهند!
همچنين ممکن است اجازه مرور و خواندن محتواي بعضي از صفحات به موتورهاي جستجو داده نشده باشد. شما به عنوان دارنده سايت، همان­طور که دوست داريد موتورهاي جستجو اطلاعات سايت شما را با خود ببرند، مي­توانيد آن‏ها را از بعضي صفحات سايت­تان دور کنيد و اجازه خواندن و بايگاني کردن محتواي آن صفحات را ندهيد. موتور جستجو اگر مؤدب باشد؛ قبل از ورود به هر سايتي ابتدا قوانين دسترسي به محتواي آن را بررسي مي­کند و از حقوق دسترسي خود اطلاع مي­يابد.
تنظيم ميزان دسترسي موتورهاي جستجو به محتواي يک طراحی وب سايت توسط پروتکل و طراحي سايت و دستوراتي خاص انجام مي­شود که در بخش‌هاي بعد بررسي شده است.
کار اسپايدر، بسيار شبيه کار کاربران وب است. همان­گونه که کاربران، صفحات مختلف را بازديد مي­کنند، اسپايدر هم درست همين کار را انجام مي­دهد، با اين تفاوت که اسپايدر کدهاي سازنده صفحات و کاربران نتيجه حاصل از کنار هم قرار گرفتن اين کدها را مي­بينند.
page1.html، صفحه­اي است که کاربران آن را به شکل زير مي­بينند:
نمونه­اي از صفحات وب که توسط مرورگرها نشان داده مي شود.
اما اسپايدر آن را چگونه مي­بيند؟
براي اين که شما هم بتوانيد دنياي وب را از ديدگاه يک اسپايدر ببينيد، کافي است که کدهاي سازنده صفحات را مشاهده کنيد. براي اين کار در مرورگر خود، مسير نشان داده شده زير را دنبال کنيد:
Firefox: View > Page Source (Ctrl+U)
IE: Page > View Source (Ctrl+S)
فراموش نکنيد شما بايد توانايي کار با هر دو مرورگر فايرفاکس و اينترنت اکسپلورر را به خوبي بدانيد و سايت خود را در هر دو مرورگر اشاره شده بازديد و بررسي کنيد تا سايت براي اغلب کاربران وب ظاهر مناسبي داشته باشد.
کدهاي اچ­تي­ام­ال صفحه page1.html به صورت زير است:
کدهاي اچ­تي­ام­ال يک صفحه وب
آيا اين دنياي متني براي شما جذاب است؟
رد پاي اسپايدر به هنگام مشاهده صفحات يک سايت روي سرور آن مي­ماند. شما اگر اجازه دسترسي به آمار ديد و بازديدهاي صورت گرفته از يک طراحی وب سايت و اتفاقات انجام­شده در آن را داشته باشيد، مي‌توانيد مشخص کنيد که اسپايدر کدام يک از موتورهاي جستجو صفحات سايت را مورد بازديد قرار داده ­­است.
يکي از فعاليت­هاي مهمي که در بازاريابي با موتورهاي جستجو انجام مي­شود، تحليل همين ديد و بازديدهاست. در بخش­هاي آتي کتاب به موضوع تحليل آمار سايت پرداخته شده است.
ب) بايگاني کننده داده­ها
تمام اطلاعات جمع­آوري شده توسط اسپايدر در اختيار ايندکسر قرار مي­گيرد. در اين بخش اطلاعات ارسالي مورد تجزيه و تحليل قرار مي­گيرند و به تکه­هاي متفاوتي تقسيم مي­شوند. تجزيه و تحليل به اين معناست که مشخص مي­شود اطلاعات از کدام صفحه ارسال شده است، چه حجمي دارد، کلمات موجود در آن کدام­اند، کلمات چندبار تکرار شده­اند و در کجاي صفحه قرار دارند، صفحه چه زماني بروز رساني شده است و…
در حقيقت ايندکسر، صفحه را به پارامترهاي آن خرد مي­کند و تمام اين پارامترها را به يک مقياس عددي تبديل مي­کند تا سيستم رتبه­بندي بتواند پارامترهاي صفحات طراحی وب سايت مختلف را با هم مقايسه کند. تمام داده­ها تجزيه و تحليل شده، گروه­بندي، کدگذاري و ذخيره مي­شوند. همچنين داده­ها قبل از آن که ذخيره شوند، طبق تکنيک­هاي خاصي فشرده مي­شوند تا حجم کمي را اشغال کند.
يک موتور جستجو بايد پايگاه داده عظيمي داشته باشد و به طور مداوم حجم محتواي آن را گسترش دهد. بزرگي و بروز بودن پايگاه داده يک موتور جستجو براي آن امتياز محسوب مي­گردد.
حجم پايگاه داده موتورهاي جستجو و روش ذخيره­سازي داده­ها در آن، متفاوت است. زماني رقابت شديدي در اعلام بزرگي پايگاه داده ميان موتورهاي جستجو وجود داشت. بعد از آن که گوگل ديگر به ارائه آمار پايگاه داده­اش ادامه نداد، عملاً رقابت به جبهه­هاي ديگري منتقل شد. هر چند بزرگي پايگاه داده امتياز محسوب مي­شود اما به نظر مي­رسد کيفيت در ارائه نتايج جستجو همچنان مورد‏توجه­ترين فاکتور براي رقابت است.
ج) تحليل­گر درخواست کاربر
پس از انجام تمامي مراحل طراحی وب سايت  گفته شده، موتور جستجو آماده پاسخ­گويي به کاربران است. آن‏ها چند کلمه را در فيلد جستجو وارد مي­کنند و سپس با فشردن دکمه جستجو، منتظر پــاسخ موتور جستجو مي‌مانند. براي پاسخ­گويي به درخواست کاربر، ابتدا تمامي صفحات مرتبط موجود در پايگاه داده، مشخص مي‌شوند. پس از آن عمل رتبه­بندي صورت مي­گيرد. به عبارت ديگر صفحات جمع‏آوري شده، از بيش‏ترين ارتباط تا کم‏ترين ارتباط با موضوع مطرح شده، به عنوان نتايج جستجو به کاربر نشان داده مي­شوند.
حتي اگر موتور جستجو بهترين و کامل­ترين پايگاه داده را داشته باشد اما نتواند پاسخ­هاي مرتبطي ارائه کند، يک موتور جستجوي ضعيف به‌شمار مي­آيد. آلتاويستا زماني مهم‏ترين موتور جستجو در وب بود اما تنها به همين دليل بازي را به گوگلِ تازه­وارد باخت. در حقيقت سيستم رتبه­بندي قلب تپنده يک موتور جستجو است. تفاوت اصلي موتورهاي جستجو نيز در سيستم رتبه­بندي مي­باشد.
سيستم رتبه­بندي براي پاسخ­گويي به سؤالات کاربران، پارامترهاي بسياري را در نظر مي­گيرد تا بتواند بهترين پاسخ­ها را در اختيار آن‏ها قرار دهد. به اين سيستم رتبه­بندي، الگوريتم گفته مي­شود. الگوريتم، مجموعه­اي از دستورالعمل­هاست که موتور جستجو با اعمال طراحی وب سايت آن‏ها بر پارامترهاي صفحات موجود در پايگاه داده­اش، تصميم مي­گيرد که صفحات مرتبط را چگونه در نتايج جستجو مرتب کند.
در حال حاضر قدرتمندترين سيستم رتبه­بندي را گوگل در اختيار دارد. سيستم رتبه­بندي گوگل پيج­رنک نام دارد که در بخش­هاي آتي کتاب معرفي شده است.
به طور خلاصه مي­توانيم فعاليت موتور جستجو را در سه مورد زير بگنجانيم:
مراجعه به صفحات و خواندن محتواي آن‏ها
بايگاني اطلاعات خوانده شده
رتبه­بندي صفحات متناسب با کلمات جستجو شده
طراحی وب سایت...
ما را در سایت طراحی وب سایت دنبال می کنید

برچسب : طراحی سایت, نویسنده : سورنا webdesign8 بازدید : 145 تاريخ : سه شنبه 24 بهمن 1391 ساعت: 20:59

آرشیو مطالب

لینک دوستان

خبرنامه