בסוף שנת 2003 הוכנס לשימוש אלגוריתם הילטופ (Hilltop Algorithm) ששימש לסיוע בדירוג תוצאות החיפוש במנוע החיפוש גוגל. הדעות חלוקות לגבי הזמן המדויק בו הוכנס האלגוריתם לשימוש (האם הוא הוכנס במסגרת עדכון פלורידה או לפני-כן), אך התקיימה הסכמה כללית כי הוא היה אכן פעיל ובשימוש מנוע החיפוש גוגל.
ניתן לומר כי אלגוריתם הילטופ הוא בעצם גרסה מוקדמת של אלגוריתם TrustRank שבו נעשה שימוש נרחב מאוחר יותר.
משמעות אלגוריתם הילטופ
אלגוריתם הילטופ נבנה על-ידי קרישנה בהראט מקליפורניה, שכתב אותו בשנים 1999-2000. בינואר 2001 הוא רשם על אלגוריתם מסוים פטנט, כאשר חברת גוגל רשומה עליו ביחד אתו. הפטנט שונה מן האלגוריתם שהוצג במאמר המקורי, ולא ברור איזו משתי הגישות היא זו שיושמה בפועל. קרישנה עדיין עובד בעת עדכון מאמר זה (2023) בחברת גוגל. אמנם גוגל לא הודיעו מעולם רשמית כי הם משתמשים באיזה מבין האלגוריתמים, אך נראה כי הם לא יוכלו להתעלם מיתרונותיהם.
אם בעבר הרחוק התעניין גוגל במספר ואיכות הקישורים המקשרים אל דף מסוים, ולא התייחס לשאלה מהיכן הגיעו קישורים אלו, אז כבר זמן רב ברור כי המשחק השתנה מאוד לאורך השנים.
דפים מומחים (Expert Documents)
בין דפי האינטרנט נוצר מעמד חדש של דפים מומחים (Expert Documents). במידה ודף מומחה מצביע אל דף אחר, אז הדבר מהווה "הצבעת אמון" בדף שקיבל את ההצבעה, וחשיבותו של הדף עולה בתוצאות החיפוש. עבור מילות חיפוש שונות יהיו דפים מומחים שונים, כשההבדל העיקרי בין המאמר של קרישנה לבין הפטנט שנרשם הוא בצורת בחירת הדפים המומחים.
דף שלא קיבל קישור (הצבעת אמון) משני דפים מומחים לפחות, לא יקבל ציון מהאלגוריתם כלל! אמנם יתכן כי הוא ימשיך להופיע בתוצאות החיפוש בשל גורמים אחרים (כגון התאמה גבוהה לכוונת הגולש, קבלת קישורים מאתרים סמכותיים במיוחד, חולשה של הדפים המתחרים או גורמים נוספים המשפיעים על איכות הדף עצמו), אך ברור כי מיקום הדף יפגע מבחינת הפוטנציאל שלו.
כפי שאמרנו – כיצד קובעים מיהו דף מומחה הוא מוקד ההבדל בין המאמר המקורי לבין הפטנט שנרשם.
המאמר המקורי אודות אלגוריתם הילטופ, מאת קרישנה בהראט (מאמר להורדה): Hilltop: A Search Engine based on Expert Documents |
רשימת דפים מומחים מוכנה מראש
אם קוראים את המאמר שכתב קרישנה בהראט, נראה כי החיפוש לפי האלגוריתם החדש בנוי משלושה שלבים:
- איתור דפים מומחים – בניית רשימת דפים מומחים מוכנה מראש מבין דפי האינטרנט. רשימה זו היא כללית וקבועה יחסית. מן הרשימה מסוננים אתרים מקושרים (ראה בהמשך).
- התאמת דפים מומחים לשאילתה – כאשר מבוצע חיפוש, הוא קודם מבוצע על רשימת הדפים המומחים, ונוצרת תת-רשימה מתוך הרשימה הגדולה של דפים מומחים לאותו נושא.
- מתן ציון מקומי לחיפוש (LocalScore) – בעת ביצוע החיפוש עצמו, ניתן ציון מקומי (LocalScore) לכל דף שעולה בחיפוש על פי טקסט העוגן של קישורים נכנסים המגיעים לאתר מתוך רשימת הדפים המומחים שנבחרה בשלב הקודם. אם אין אל האתר לפחות שני קישורים מדפים מומחים, אז הדף כלל לא יקבל נקודות מהאלגוריתם.
דפים מומחים מוגדרים כדפים אודות נושא מסוים, שנבנו במיוחד כדי להפנות משתמשים למידע באינטרנט על אותו נושא, כלומר שיש בהם קישורים לאתרים אחרים שאינם קשורים אליהם (Affiliated). דוגמאות לדפים מומחים יהיו דפים באינדקסים, אתרים מוסדיים (.org, .gov) ואתרים אוניברסיטאיים (.edu). משמעות עובדה זו היא כי לא מספיק להשיג קישורים מאתרים מסחריים כמו בעבר. צריך להשיג קישורים מדפים בעלי סמכות, שמטבעם יותר קשים להשגה.
חשיבות הרישום הנכון לאינדקסים חשובים וחזקים ואתרים מומחים אחרים עלתה מאד, וירדה חשיבות קישורים מאתרים ודפים "סתם". משמעות נוספת היא חשיבות גדולה לטקסט העוגן בדפים המומחים המקושרים לדף שלכם.
חיפוש תוך דירוג מחדש (Rerank)
אם מביטים בפטנט אותו הוציא קרישנה בהראט יחד עם גוגל, אז נראה כי החיפוש לפי האלגוריתם החדש בנוי משלושה שלבים:
- חיפוש ראשוני – ביצוע חיפוש רגיל על מילת החיפוש כפי שנעשה לפני הצגת האלגוריתם.
- ניפוי דפים מקושרים (Affiliated) – הורדת דפים הקשורים בינהם (ראה בהמשך).
- מתן ציון מקומי לחיפוש (LocalScore) – מתן ציון מקומי (LocalScore) לדפים ברשימה על-פי הקישורים המגיעים אליהם מדפים הנמצאים גם הם ברשימה. ההנחה הבסיסית היא שהדפים ברשימה הם הרלוונטיים לחיפוש זה, ולכן יחשבו רק קישורים מדפים ברשימה.
דפים מקושרים (Affiliated)
בעת ניקוי רשימת הדפים המומחים, מבוצע הניקוי על ידי הורדת דפים בעלי שם דומיין משותף (domain.com, domain.co.il, two.domain.com, www.domain.com) או שהדפים נמצאים באותה קבוצת IP, מ-Class C זהה (שלושת המספרים הראשונים ב-IP זהים – 212.125.23.XXX לדוגמא).
מה קורה עם מונחי חיפוש שוליים?
הדבר תלוי kאיזו גרסה של הילטופ מתייחסים. אם מתייחסים לגרסה השנייה, אז כנראה שכל מה שנדרש הוא שתהיה רשימה ראשונית מספיק גדולה (לאחר סינון דפים קשורים) למילת החיפוש השולית. אם אין מספיק אתרים אז האלגוריתם אינו מופעל.
אם מאמינים בגירסא הראשונה, אז אם החיפוש שנעשה אינו מופיע בין מונחי החיפוש הפופולריים להם הוכנו (או נמצאו בזמן אמיתי) רשימות דפים מומחים, גוגל חוזר להשתמש בשיטת החיפוש הישנה (כלומר, ללא הילטופ).
כיצד מתמודדים עם הילטופ?
קודם כל, ממשיכים לעשות את כל הדרישות קידום אתרים שעשיתם עד כה – אופטימיזציה של האתר או בניית קישורים לשם שיפור ה-PR וציון הרלוונטיות של האתר, עבור ביטויים שאתם מקדמים. משקלם של גורמים נותר משמעותי מאוד עד היום.
המפתח להתמודדות עם הילטופ הוא זיהוי האתרים והדפים המוגדרים כמומחים בתחומו של האתר שלכם. כיצד מוצאים אותם? תלוי באיזו שיטה מאמינים. אם מדובר על רשימת מומחים מוכנה מראש, אז אינדקס האתרים דמוז (DMOZ) יהיה אחד מהמומחים, וכך גם Yahoo!. אינדקסים אחרים אולי נראים כמומחים, אך אינם בהכרח כאלה.
לפי השיטה השנייה צריך לבצע חיפוש אחר מילת החיפוש, ולנסות להשיג קישורים מהדפים המופיעים בתוצאות החיפוש. כמו-כן, כדאי לבדוק את הקישורים הנכנסים אל דפים המופיעים בתוצאות החיפוש בראש התוצאות, ולנסות להשיג את אותם קישורים.