כמעט ואין אתר שלא קיימת בו בעיה מהותית של תוכן משוכפל. כפילות תוכן יכולה לפגוע במאמצי קידום האתר, ולגרום לניצול לא יעיל של משאב הסריקה של מנועי החיפוש. אחד הכלים החשובים להילחם בתופעה זו היא תג Canonical.
מהו תג קנוניקל?
תג Canonical הינו אלמנט HTML אשר ממוקם באזור ה-Head של הדף, אשר מסייע לבעל האתר להכריז מהי כתובת ה-URL המועדפת, מבין מספר כתובות URL אשר נסרקות על ידי גוגל בצורה נפרדת, אך מכילות כולן תוכן זהה או דומה מאד.
במהלך פברואר 2009, כל מנועי החיפוש הגדולים (גוגל, מייקרוסופט, יאהו) הכריזו על תמיכתם בתג זה. יחד עם זאת, חשוב להבין כי תג ה-Canonical מוגדר בתור המלצה בלבד, וכי מנועי החיפוש אינם מתחייבים לעשות שימוש במידע המופיע בו (בניגוד להפניות קבועות מסוג 301).
כיצד נוצרות בעיות כפילות תוכן?
בעיות כפילות תוכן יכולות להתעורר עקב סיבות רבות ומגוונות. הנה כמה דוגמאות:
- שימוש בפרמטרים ב-URL המשנים את צורת התצוגה אך לא את התוכן.
- אתר מסחר אשר מציע מוצרים עם תוכן זהה, אך עם הבדלים מינוריים בין הדפים (כמו צבע מוצר או מידה)
- כפילות תוכן כתוצאה ממאמרים המופיעים בכמה צורות תצוגה, כגון גרסת הדפסה, AMP, גרסה מיוחדת למכשירים ניידים וכדומה.
- סיבות טכניות אשר מאפשרות סריקה של דפים במספר כתובות, כמו לדוגמא מצב בו שני שמות דומיין מפנים לאתר אחד.
כמובן שקיימות עוד דוגמאות רבות נוספות, אך קצרה היריעה מלפרט. תג קנוניקל (Canonical Tag) נועד להילחם בדיוק במקרים מסוג זה!
מילה של אזהרה
מאחר והגולש איננו עובר בפועל אל הכתובת המופיעה בתג הקנוניקל, אז במידה והמידע המופיע בתג אינו מדויק (בשל טעות תכנות לדוגמא), אז בהחלט יתכן כי לא נשים לב לטעויות המופיעות בתג זה. תג קנוניקל המוגדר לא נכון יכול ליצור נזק ממשי ובעיות קשות בסריקה. זוהי גם הסיבה כנראה מדוע גוגל מתייחסים אליו כהמלצה בלבד.
הנה דוגמאות למצבים בהם יכול תג המוגדר לא טוב לגרום לנזק חמור:
- כל הדפים באתר כוללים בתג את אותה הכתובת (לדוגמא: דף הבית)
- הכתובת המופיעה בתג מפנה בטעות לכתובת שגויה שאינה קיימת
- הכתובת המופיעה בתג מפנה בטעות לכתובת המפנה בחזרה לכתובת הנוכחית (מה שיוצר לולאת הפניות)
- הכתובת המופיעה בתג מפנה אל דף ב-http כאשר האתר הוא ב-https
הפניה קבועה (301) לעומת Canonical Tag
בעוד הפניה קבועה מסוג 301 מחייבת את מנועי החיפוש לעקוב אחריה, השימוש בתג Canonical, כאמור, משמש כהמלצה בלבד אותה האלגוריתם כמובן לוקח בחשבון. התג יהווה פתרון בעיקר עבור שני מקרים עיקריים:
- תוכן משוכפל או דומה מאד
כאשר שני דפים (או יותר) מכילים תוכן משוכפל, או כמעט זהה, ושניהם צריכים להיות זמינים עבור הגולש. במקרים כאלה, אין טעם לבצע הפנית 301 מאחר ושני הדפים צריכים להיות באוויר. הדוגמא השכיחה ביותר למצבים אילו היא דפי מוצרים בצבעים שונים או מידות שונות. במצב זה, הפתרון הטוב ביותר יהיה לשלב את תג ה-Canonical בכל אחד מהכפילויות ולוודא שערך התג מצביע על כתובת URL אחידה. - מגבלה טכנית לביצוע הפניית 301
כאשר נדרשת הפניה קבועה מסוג 301 אך מסיבות שונות, לא ניתן לבצע אותה. במקרים אלו יכולים להתעורר כתוצאה ממגבלות טכניות של בעל האתר או ה-Webmaster. במצב זה, ניתן להמיר את הדרישה בהפניית 301 בשימוש ב-Canonical. אך יחד עם זאת, כדאי לזכור כי מנועי החיפוש לא בהכרח יעקבו אחר התוכן של התג, וכי הפנית 301 היא הפתרון המועדף (כל זאת במקרה שכפילויות התוכן אינן צריכות להיות זמינות במספר כתובות URL בניגוד למקרה הראשון).
כיצד להשתמש בתג על מנת לציין כתובת URL קנונית?
ניתן לעשות זאת באמצעות שתי דרכים מרכזיות. הדרך הראשונה (והשכיחה יותר) דורשת שילוב של אלמנט ה-Canonical בקטע ה-Head של כל דף HTML אשר מהווה כפילות URL של עמוד אחר.
לדוגמא, נניח שקיימות הכפילויות הבאות:
- http://www.example.com/category.php?item=210?sort=price
- http://www.example.com/category.php?item=210?sort=date
כתובות ה-URL הללו מצביעות למעשה על אותו עמוד, אך כל אחת מהן מציגה את התוכן במיון שונה. לכן, שתיהן צריכות להיות זמינות עבור הגולש, ולכן הפניית 301 לא תהווה פתרון מתאים לטיפול בכפילויות זו. במקרה כזה, הפתרון הטוב ביותר יהיה שילוב תג Canonical שיצביע על הכתובת ה"קנונית" של העמוד. כך ייראה התג:
<link rel="canonical" href="https://www.website.com/page/">
שימו לב: ערך הקישור יכול אמנם להיות יחסי או אבסולוטי, אך ההמלצה הרשמית של גוגל היא להשתמש בכתובת אבסולוטית מלאה. הסיבה לכך היא שזה יכול למנוע בעיות פוטנציאליות נוספות, לדוגמא: כפילות של שם הדומיין ללא www לעומת הכתובת בתוספת www או כפילות של גרסת האתר המאובטחת(HTTPS) עם זו הלא מאובטחת (HTTP).
הדרך השנייה להשתמש בתג, היא באמצעות ציון הגרסה הקנונית על-ידי שליחת תגובת שרת, אשר מכילה את כותרת ה-rel="Canonical". אפשרות זו מיועדת בעיקר עבור מצבים כמו גרסת PDF אשר זמינה להורדה ומהווה כפילות של עמוד URL אחר באתר.
Cross Domain Canonical
ניתן להשתמש בתג ה-Canonical על מנת לטפל במקרי כפילויות בין שמות דומיין שונים. לדוגמא: כאשר עמוד מאמר משוכפל בין מספר אתרים השייכים לאותה חברה, ניתן להגדיר Cross Domain Canonical בכל אחת מהכפילויות, אשר יצביע על ה-URL בדומיין המועדף. אנו שוב מדגישים כי פתרון זה מתאים רק עבור אותם מצבים בהם כפילויות התוכן צריכות להישאר זמינות במספר כתובות. אם המצב מאפשר איחוד של הכתובות, מומלץ לנתב מחדש את הכתובות באמצעות הפניית 301.