ICT مرکز آموزشی   

Information Communication Technology

آموزش وب

موتورهای جستجو

............................................

موتورهای جستجو

در اين بخش ميخواهم در مورد سايت هاي جستجو يا موتورهاي جستجوگر search engines و اهميت آنها براي سايت شما صحبت کنیم. هر هدفي را که از ساخت يک وب سايت دنبال ميکنيد ، تا زمانيکه سايت شما شناخته نشده باشد، به آن هدف نخواهيد رسيد. بطور معمول ، هدف از ساخت يک وب سايت يا اطلاع رساني است يا کسب درآمد و يا ميتواند هر دو آنها باشد که به نظر من اين آخري از همه بهتر است. در هر حال شما بعد از راه اندازي سايتتان نياز به يک تبليغات گسترده براي جلب بيننده بيشتر داريد، اين نکته را هميشه در ذهن بسپاريد، هر چه بيننده وب سايت شما بيشتر باشد، موفقيت شما بيشتر خواهد بود، هر بيننده برابر با يک امتياز و يا شايد هم بيشتر.

يکي از اساسي ترين راههاي جذب بيننده، ثبت صفحات سايت در موتورهاي جستجوگر search engines است، چون هر کسي در هر کجا که باشد ميتواند سايت شما را پيدا کند.

 

موتور جستجوگر چيست؟

در حال حاضر تعداد زيادي سايت جستجوگر مانند، AltaVista, Mama, Yahoo, Google داريم که هر کدام از اينها توسط برنامه هاي گردشگر بنام spider, web crawler, robot مرتب در وب بدنبال صفحات جديد و يا تغييريافته ميگردند و به محض پيدا کردن آنها، اطلاعات مورد نظر را در پايگاه داده ايDatabase  خود، ليست ميکنند تا در موقع لزوم و بهنگام جستجو در اختيار کاربران قرار دهند. زمانيکه شما بدنبال يک کلمه کليديkeyword  در آن سايتها مي گرديد، اطلاعات پايگاه داده اي آنها را جستجو ميکنيد و سپس نزديکترين مطالب به کلمه کليدي را براي شما نمايان ميکنند که هر چه آن کلمه دقيق تر باشد، شما به مطلب مورد نظر زودتر و راحت تر دسترسي پيدا ميکنيد.

 

چگونه صفحات در پايگاه داده اي Database  ليست ميشود؟

هنگاميکه robot ها و يا يک برنامه گردشگر ديگر بطور اتوماتيک گردش خود را شروع ميکند، به محض يافتن يک سايت جديد در وب ابتدا به سراغ فايلي بنام robots.txt ميگردد، سپس مطالب قسمت HEAD و بدنبال آن اطلاعات نوشته شده در متاتگها را جمع آوري ميکند و پس از يک پردازش دقيق با استفاده از يک الگوريتم مخصوص، صفحات را در پايگاه داده اي خود ذخيره و ليست ميکند.

 

فايل robots.txt چيست؟

robots.txt يک فايل متني است که اين فايل را ميتوانيد در سرور و در دايرکتوري وب سايت خود قرار دهيد تا تنظيمات گردش برنامه هاي گردشگر را در آن کنترل کنيد و در حقيقت زحمت اين برنامه ها را کم کنيد. اما اطلاعاتي که در اين فايل بايد قرار گيرد الگوي خاصي دارد که در زير به آن اشاره شده و در آن سطح دسترسي گردشگرها را با ذکر نامشان معين ميکنيد،

User-agent:

Disallow:

اين دو خط را در فايل متني وارد و آنرا با پسوند txt ذخيره ميکنيد.

User-agent به برنامه هايي ميگويند که براي وب ساخته ميشوند تا در اختيار کاربران قرار گيرند و گردشگر ها مانند robot ها و crawler ها از اين قبيل هستند و هر سايت جستجو يک گردشگر با اسم مشخص دارد، مانند سايت گوگل که بنام Googlebot معروف است. براي تعيين سطح دسترسي بايد نام برنامه را در خط اول بنويسيد و در خط دوم هم نام فايلها يا دايرکتوري هاييکه نبايد ليست شوند را مينويسيد. اگر بطور کل نميخواهيد سايت شما ليست شود طبق دستور زير عمل ميکنيد:

User-agent: *

Disallow: /

براي اطلاعات بيشتر در مورد robots.txt به سايت www.robotstxt.org  مراجعه کنيد.

 

نقش متاتگها meta tags براي موتورهاي جستجو

شما درباره ساخت متاتگها در بخش HEAD مطالبي را آموختيد. در اين قسمت نقش آنها را در search engine ها ياد خواهيد گرفت. گردشگرها بيشتر به متاتگها حساس هستند تا اطلاعاتي را در اختيارشان قرار دهند. اطلاعاتي را که شما در متاتگها بايد وارد کنيد به شرح زير ميباشند:

  • معرفي کلمات کليدي  keywords
  • توصيف Description کوتاهي درباره سايت که در بعضي از سايتهاي جستجو عمل نميکند.
  • معرفي برنامه سازنده سايت که به اسم Generator معروف است.
  • معرفي سازنده و طراح سايت که بنام Author معروف است.
  • مشخص کردن کپي رايت .
  • تعيين تاريخ انقضا صفحات اگر مرتب در حال تغيير هستند.

 

هر موتور جستجوگر اصول و قوانين خاص خود را براي ليست و ذخيره کردن ( index )    سايت شما و تعيين رتبه آن ( Page Ranking ) دارد که متا تگها در اين مورد نقش اساسي دارند و شما در انتخاب و تعيين آنها بايد بسيار دقت کنيد. بطور مثال بکار بردن کلماتيکه در متا تگها به عنوان keyword انتخاب نموده ايد در متن داخل همان صفحه در رتبه بنديpage ranking   صفحه بسيار موثر خواهد بود.

 

منظور از رتبه بندي( Page Ranking ) چيست؟

اگر شما داخل يکي از سايتهاي جستجو مانند گوگل بدنبال کلمه اي گشته باشيد متوجه ميشويد که بعضي از سايتها در همان صفحه هاي اول هستند ولي بقيه در صفحه هاي آخر، که اين ترتيب بر اساس رتبه بندي يک سايت است که آن سايت در ابتدا نشان داده شود يا در آخر ليست باشد. اگر اصول و قوانين رتبه بندي يک موتور جستجو را رعايت کنيد ، سايت شما هم بعد از مدتي در صفحات ابتدايي نمايش داده خواهد شد.

در بخش بعدي مطالبي را در مورد بهترين و معروفترين سايت جستجو يعني گوگل جمع آوري کردیم که براي ثبت و رتبه بندي سايت شما بسيار مفيد است.

....... ....... ......

ثبت سايت در گوگل

 

طرح ساخت اين سايت توسط دو دانشجو بنامهاي Larry Page و Sergey Brin در يکي از خوابگاههاي دانشگاه استانفورد پي ريزي شد و بعد از مدتي به بزرگترين و محبوبترين موتور جستجو    ( search engine ) در دنيا تبديل شد که در حال حاضر بيش از هشت ميليارد صفحه وب را در پايگاه داده اي ( database ) خود جمع آوري کرده که توسط يک الگوريتم منحصر بفرد و با سرعت بسيار بالا خدمات جستجو را براي کاربران انجام ميدهد تمام اين فرآيندها داخل يک شبکه با بيش از هزار کامپيوتر انجام ميشود. البته اين سايت به غير از جستجو، خدمات ديگري هم انجام ميدهد که ميتوانيد به آدرس www.google.com مراجعه کنيد.

 

ثبت سايت در Google

يکي از راههاي بالا بردن ترافيک يک سايت، ثبت آن در گوگل ميباشد که براي اينکار شما ميتوانيد به آدرس www.google.com/addurl.html  مراجعه و سايت خود را ثبت کنيد. دقت کنيد که داخل فرم مخصوص در آن صفحه آدرس کامل سايت را بهمراه پيشوند http:// بايد وارد کنيد و در ضمن نيازي به ثبت همه صفحات نيست و فقط صفحه اصلي يا همان homepage کافي است چون گردشگر گوگل بنام Googlebot بقيه محتواي سايت را از همان صفحه اول پيدا ميکند. پس فراموش نکنيد که صفحه اصلي شما بايد به همه نقاط سايت لينک داشته باشد.

بعد از ثبت سايت ممکن است مدتي در حدود يکماه طول بکشد تا در جستجوها صفحات شما نمايش داده شود.

 

رتبه بندي صفحات يک سايت ( Page Ranking )

يکي از نکاتي که خيلي بايد دقت کنيد، رعايت کردن اصول و قوانين گوگل ميباشد تا صفحات سايت شما در رتبه هاي اوليه هنگام جستجو قرار گيرد. پس از يافتن سايت شما توسط Googlebot ، صفحات تجزيه تحليل ميشوند و در يک الگوريتم، رتبه ميگيرند. براي بالا بردن اين رتبه، نکات زير را بايد رعايت کنيد:

 

نکات لازم در مورد طراحي

  • صفحات سايت بايد داراي لينکهاي منظم باشد تا دسترسي را به کليه نقاط سايت آسان کند.
  • بطور حتم يک صفحه بنام site map ( نقشه سايت ) درست کنيد و کليه لينکهاي سايت را در آن قرار دهيد و اگر بيشتر از صد لينک داريد، بقيه را در يک صفحه ديگر قرار دهيد.
  • داخل هر صفحه از مطالبي استفاده کنيد که با عنوان صفحه و کلمات کليدي( keywords ) مرتبط باشد.
  • کلمات کليدي را که در متاتگ مشخص کرده ايد بايد در همان صفحه بکار برده شود.
  • بطور حتم از نشان دادن کلمات کليدي، بصورت متن استفاده کنيد بجاي بکار بردن تصوير.
  • در خصوصيت alt تگها از توضيحات مرتبط با عنوان صفحه و محتواي صفحه استفاده کنيد.
  • اصول بکار بردن صحيح کدهايHTML   را رعايت کنيد.
  • صفحات پويا ( dynamic pages ) يعني صفحاتيکه در آدرس آنها علامت ? است، براحتي صفحات معمولي ليست نميشوند.
  • در هر صفحه کمتر از صد لينک بکار بريد .

 

نکات فني

  • گردشگر گوگل ( Googlebot ) با جاوااسکريپت، کوکي ها، session ID ، DHTML ويا Flash مشکل دارد.
  • از وجود If-Modified-Since HTTP header در وب سرور سايت خود اطمينان حاصل کنيد چون اين ويژگي تغييرات سايت شما را به گردشگرها اعلان ميکند.
  • از فايل متنيrobots.txt  در دايرکتوري سايت خود استفاده کنيد و دقت کنيد که از Googlebot crawler در آن فايل جلوگيري نشده باشد.
  • با متخصصين سرور مشورت کنيد تا از نرم افزارهاييکه از فعاليت گردشگرها جلوگيري ميکند، استفاده نشود.

پس از رعايت کردن اين نکات به آدرس http://www.google.com/addurl.html مراجعه کنيد و سايت خود را در آن ثبت کنيد.

نکات ديگري هم هست که توسط متخصصان سايت گوگل توصيه ميشود،

  • صفحات را براي استفاده کاربر بسازيد نه براي موتورهاي جستجو.
  • از حقه هايي براي بالا بردن رتبه سايت دوري کنيد.
  • از گذاشتن لينک سايتهايي که در رتبه بندي شما اثر منفي دارند بپرهيزيد، مانند سايتهايي که روي اصول طراحي نشده اند و يا فعاليتهاي غيرقانوني انجام ميدهند مثل web spammer ها.
  • از بکارگرفتن برنامه هايي که بصورت غيرقانوني سايت شما را ثبت و رتبه آنرا بالا ميبرند دوري کنيد مانند برنامه WebPosition Gold .
  • از لينکها يا متنهاي پنهان استفاده نکنيد.
  • صفحات را با متنهاي بيربط پر نکنيد.
  • از بکار بردن متنهاي تکراري يا تکرار صفحات با يک مضمون پرهيز کنيد.
  • براي يافتن سريعترسايت شما، لينک خود را در سايتهاي معروف قرار دهيد.

 

اين نکته را به خاطر بسپاريد که اگر از اصول غير قانوني استفاده کنيد، يا سايت شما ليست نخواهد شد و يا اگر ليست شده باشد ، حذف ميشود و امکان بازگشت مجدد هم براي آن سايت وجود نخواهد داشت.

 


_-لینک های سریع- _
Web Hosting by: D.M™ Soft.

Copyright © 2009 by D.M Soft . and its licensors. All rights reserved.