דפים מן האתר שלי מופיעים בלי כותרת או תוכן
תופעה נפוצה בגוגל היא מצב בו דפים מופיעים בתוצאות החיפוש כאשר במקום כותרת הדף מופיעה הכתובת שלו (URL), לאתר לא מופיע קטע טקסט מתוך האתר, ולא מופיעה הפנייה אל גירסת המטמון של הדף.
תוצאת חיפוש מסוג זה תראה דומה לתוצאה הבאה:
www.seoisrael.co.il/page.htm
דפים דומים
ניתן לשים לב כי בתוצאה זו לא מופיע הקישור אל "מטמון" המופיע בתוצאות רגילות (או cache בתוצאות גוגל באנגלית).
קודם כל, כדי להרגיע את אלו שנכנסים ללחץ ממצב זה, אין מדובר בדרך כלל בעונש שהוטל על האתר על-ידי גוגל. אפילו דפים של גוגל עצמו מופיעים במצב זה (בצעו חיפוש על site:www.google.com כדי להיווכח בעצמכם).
תופעה זו יכולה להיגרם ממספר סיבות, והנה השכיחות שבהן:
- דף חסום לסריקה על-ידי קובץ robots.txt – כאשר קיים דף באינדקס של גוגל בו יש קישור אל דף אחר, אך הדף האחר חסום לסריקה של גוגל על ידי קובץ robots.txt.
- שגיאה בעת נסיון סריקה של דף – בזמן שרובוט הסריקה של גוגל ניסה לקרוא את הדף, הוא קיבל הודעת שגיאה (השרת היה לא פעיל, הדף החזיר הודעת שגיאה, וכו').
- הדף עדיין לא נסרק – לעיתים זוהה קישור אל דף חדש שלא מופיע עדיין באינדקס של גוגל, אך הדף עדיין לא נסרק על-ידי רובוט הסריקה. כאשר נתקלים בבעיה מסוג זה, יש לבדוק האם קובץ robots.txt שלכם תקין והאם אין תג Meta Robots שמונע את הגישה של מנועי החיפוש. אם הכל תקין, אז כל מה שנותר לעשות הוא להמתין לסריקה הבאה של רובוט הסריקה של גוגל, או להשיג קישור נכנס ישירות לעמוד זה.
כפל בין האתר בלי www והאתר עם www
בעיני גוגל, האתר שלכם עם www או בלי www הם שני אתרים שונים (למרות שגוגל מבצע מאמצים רבים לזהות כי בכל זאת מדובר באותו אתר). על מנת למנוע מצב של כפילות תוכן, בו כל דף שלכם מופיע פעמיים (ואז גוגל זורק באופן אקראי את אחד מן הדפים מהאינדקס), יש לוודא כי הדפים ללא www מופנים באופן אוטומטי אל הדפים עם ה-www (או להיפך).
על מנת לבצע את ההפניה ישנן כמה דרכים:
- דרך החברה בה אתם מבצעים את אחסנת האתר.
- באמצעות קובץ htaccess (אם האתר מאוחסן על שרת unix או linux).
- באמצעות שורות קוד אותן מוסיפים לקוד php או aps.
- שימוש בתג Canonical.
האפשרות הראשונה היא הברורה ביותר – לפנות אל ספק השירות שלכם ולבקש ממנו לבצע את ההפניה.
האפשרות השניה דורשת הוספת קוד אל קובץ htaccess של האתר שלכם (יש להחליף את הסוגריים המרובעות לסוגריים מסולסלות):
RewriteEngine On
RewriteCond %[HTTP_HOST] !^www.domain.co.il$
RewriteRule (.*) http://www.domain.co.il/$1 [R=301,L]
האפשרות השלישית היא באמצעות הכנסת קוד אל דפי ה-asp או ה-php שלכם.
דוגמא לקוד ASP:
if lcase(request.servervariables( "HTTP_HOST")) = "domain.co.il" then
Response.Status="301 Moved Permanently"
Response.AddHeader "Location", "http://www.domain.co.il/"
end if
קוד זה מבצע בדיקה האם הדומיין ממנו הגיעה הקריאה הוא domain.co.il, ובמידה והיא כן, אז מבוצעת הפניה קבועה אל www.domain.co.il. את ההפניה יש לבצע לפי כל כתיבה אל הדף, כלומר לפני תגי ה-html וה-head.
בסיום ביצוע ההפניה יש לוודא כי ההפניה אכן בוצעה, וכי היא אכן הפנייה קבועה ולא הפניה זמנית. כמו-כן יש לוודא כי ההפניה לא מפנה את כל דפי האתר אל דף הבית:
דוגמא להפניה לא טובה:
domain.com/page.htm -> www.domain.com
דוגמא להפניה טובה:
domain.com/page.htm -> www.domain.com/page.htm
כלי לבדיקת HTTP header של אתר או דף:View HTTP Request and Response Header
האפשרות הרביעית היא באמצעות שימוש בתג Canonical על מנת להצביע על כתובת אחידה של דף, עם כמה גרסאות. את תג ה-Canonical יש להטמיע ב- של העמוד. לדוגמא, במידה ולעמוד הבית יש כמה כפילויות: www.domain.com/example.html לעומת www.domain.com/example.html?page=1, יש להטמיע את תג ה-Canonical ב- של הדף, כך שיופיע בשתי הכפילויות ויצביע על כתובת אחידה. דוגמא לתוכן תג Canonical:
< link rel="canonical" href="http://www.domain.com/example.html" />
השימוש בתג ה-Canonical אפשרי החל מפברואר 2009, על מנת לסייע במלחמה בתוכן המשוכפל. שימוש לב שכל מנועי החיפוש תומכים בתג זה בצורה מלאה, ומתייחסים אליו כאל הפניות קבועות מסוג 301.