בימים האחרונים מתחוללת מלחמה בין יאהו לבין גוגל לגבי השאלה למי יש אינדקס גדול יותר. את המלחמה התחילו אנשי יאהו שפירסמו כי האינדקס שלהם כולל כיום 20 מיליארד פריטים (דפים, תמונות, סרטים וכו'). פריטים אלו כוללים 19.2 מיליארד דפי אינטרנט, 1.6 מיליארד תמונות, ומעל 50 מליון קטעי וידאו ואודיו. מספרים אלו באים מול המספר 8,168,684,336 אותו מציג גוגל בתור מספר הדפים הנמצאים באינדקס שלו (מספר שלא עודכן אגב כבר למעלה משנה), מה שהופך את הנתונים של יאהו לסטירת לחי ישירה לגוגל.
האם יש אמת בנתונים של יאהו? אנשי גוגל טוענים שלא, ולכן הם הציעו ל-John Battelle לבצע בדיקה של הנתונים, כולל בדיקה של המדיניות לגבי אתרי מראה ועותקים של דפים (duplicate content) לדוגמא. בינתיים גוגל מוכנים לומר כי הם "מבולבלים מן הנתונים של יאהו, וכי הנתונים הנמצאים בידיהם אינם תומכים במספרים אותם הציגו אנשי יאהו."
צריך תמיד לזכור כי גודל האינדקס אינו מצביע בהכרח על איכות החיפוש, והוא משמש בעיקר לצרכי האדרת שם האינדקס. גוגל הרי מציגים את גודל האינדקס שלהם בגאווה בדף הראשי שלהם.
אגב, בדיקה קטנה שעשיתי: המילה google מופיעה באינדקס יאהו 475 מליון פעמים, ובאינדקס של גוגל רק 240 מליון פעמים.