לאורך שנים היה אלגוריתם PageRank של גוגל מרכזי מאד בקביעת מיקומים של אתרים במנוע החיפוש. הבעיה הייתה שבעלי האתרים ומקדמי האתרים הבינו זאת, והתחילה פעילות ענפה של יצירת קישורים שנועדו לקידום במנועי החיפוש ולא לתועלת הגולש. מסיבה זו, הורידו אנשי גוגל את חשיבות אלגוריתם PageRank בצורה דראסטית, כנראה עד כדי אי הכללתו באלגוריתם הדירוג לגמרי.
אך האם ניתן "לתקן" את אלגוריתם PageRank? מה, לדוגמא, היה קורה אם גוגל היה אוסף אליו חזרה את כל ה-PageRank המצוי ברשת, ומחלק אותו מחדש רק לקבוצה קטנה של אתרים עליהם הוא סומך? האתרים הללו היו יכולים לתת את ה-PageRank שלהם לאתרים עליהם הם סומכים, וכן הלאה, בדומה לצורת ההפצה שבה השתמש אלגוריתם PageRank.
זהו בדיוק אלגוריתם TrustRank אותו הציעו כבר ב-2004 שלושה מדענים מאוניברסיטת סטנפורד. במקום הדמוקרטיה אותה ניסה אלגוריתם PageRank ליצור באינטרנט, בה לכל דף יש קול PageRank אחד, האלגוריתם החדש דוגל בריכוז של כל יכולת ההצבעה אצל קבוצה קטנה של אתרים עליה גוגל "סומך", ומאפשרים לאותה קבוצת אתרים להפיצו כראות עינה. להתראות דמוקרטיה – שלום שלטון המיעוט.
הנחות היסוד של האלגוריתם
הנחת היסוד המרכזית של אלגוריתם TrustRank היא כי אתרים עליהם "ניתן לסמוך" יקשרו בדרך כלל בעיקר אתרים אחרים עליהם "ניתן לסמוך", אלא, כמובן, אם הונו אותם. אתרים "רעים" בהחלט יכולים לקשר אל אתרים טובים כחלק מהניסיון שלהם להראות "טובים". לכן, ההנחה היא שה-TrustRank יועבר בעיקר אל אתרים ודפים "טובים" – כי כולם מצביעים עבורם – גם אתרים "טובים" וגם אתרים "רעים".
הנחת יסוד שניה היא כי דפים בהם יש הרבה קישורים יוצאים, שמים פחות לב אל מי הם מקשרים. לכן, בדומה ל-PageRank, גם באלגוריתם זה ההצבעה של דף מתחלקת בין כל הקישורים היוצאים ממנו.
הנחת יסוד שלישית היא כי ככל שתתרחק מן הסט הראשוני של האתרים "הטובים", כך הדפים בהם תפגוש יהיו יותר ויותר דפים עליהם תוכל פחות "לסמוך". לכן, בדומה לאלגוריתם PageRank, גם באלגוריתם TrustRank ישנו אלמנט שיכוך (Dampening), הגורם לכל הצבעה להיחלש ככל שהיא מתרחקת מהאתר "הבטוח" הראשוני.
הנחה נוספת המובאת במאמר היא כי מספיק להשתמש בסט של לא יותר מכ-200 אתרים בקבוצה הראשונית כדי לקבל תוצאות טובות, מה שאומר שלא יהיה צורך כמעט בהתערבות אדם רבה בתהליך, למעט בתהליך בחירת סט האתרים הראשוני או עדכונו.
סך-הכל שיפור של PageRank
אלגוריתם TrustRank, למרות כל המתמטיקה הסבוכה שקיימת במאמרים העוסקים בו, הוא בסך הכול שיפור והתאמה של אלגוריתם PageRank לבעיית הספאם שנוצרה בעקבותיו. זו גם הסיבה מדוע גוגל כנראה כל-כך התלהב מן האלגוריתם. הרי כדי ליישם אותו, לא צריך היה לבנות שום מערכת חדשה. צריך בסך הכול להכניס שינויים קטנים במערכת שכבר הייתה קיימת ועבדה היטב.
אבל בטיפול באלגוריתם TrustRank גוגל לא חזרו על הטעות אותה עשו עם PageRank, ולא חשפו את הציון של כל דף לציבור, וגם לא חשפו את רשימת האתרים שהיו חלק מן הקבוצה הראשונית שלו. בצורה זו נפגעה היכולת של "מכירת" TrustRank – כלומר מכירת קישורים מאתרים "חשובים", אך כמובן לא נעלמה.
הבדלים בין PageRank לבין TrustRank
ההבדל העיקרי בין שני האלגוריתמים, מעבר כמובן לחלוקה השונה של הכוח בתחילת הרצת האלגוריתם, הוא שאת אלגוריתם PageRank מריצים מספר רב של פעמים עד שמתקבלים ערכים יציבים יחסית. לעומת זאת, את אלגוריתם TrustRank מריצים רק מספר מוגבל של פעמים, כדי לא לתת ל-"מנות האמון" להתרחק יותר מדי מן האתרים הראשוניים. כמה פעמים מריצים את האלגוריתם? לא ברור. די ברור שאם מריצים את החישובים מספר רב של פעמים, יתקבל בסופו של דבר מצב הקרוב לתוצאות ה-PageRank שקדם לו, אך עדיין לא בדיוק.
האם גוגל משתמש באלגוריתם?
סביר להניח שגוגל עשה שימוש באלגוריתם זה, אך עם הופעת אלגורית SpamBrain, סביר כי הוא החליף אותו במידה רבה או שהוא כולל אותו בתוכו. קשה לדעת בוודאות. בכל מקרה, חשוב לזכור כי אלגוריתם TrustRank היה רק אחד מתוך מאות גורמים אחרים בקביעת דירוג הדפים בתוצאות החיפוש. עם זאת, יש היגיון רב במתן ציון רלוונטיות גבוה יותר לאתר המקושר מאתר סמכותי אחר, הרלוונטי לעולם התוכן של האתר המקושר. כחלק מעבודת קידום אתרים יסודית ומקצועית, מומלץ לשפר את מערך הקישורים הנכנסים לאתר, מאתרי סמכות הרלוונטיים לתחום המקודם.