באוגוסט 2009 התייחסו אנשי גוגל בפעם הראשונה לעדכון אותו הם כינו עדכון קפאין, אותו הם העמידו לבחינת ציבור הגולשים לשם קבלת תגובות והערות לגבי תפקוד המערכת החדשה. עכשיו הוכרזה רשמית הכנסתו של עדכון קפאין בצורה מלאה, כלומר, מערכת קפאין החליפה את מערכת האינדוקס הישנה של גוגל.
אז מה היא מערכת קפאין (Caffeine)? למעשה מדובר בשינוי מאד עמוק בצורה שבה גוגל מטפל במידע המגיע אליו ממערכת הסריקה שלו. בעבר הגיע המידע ממערכת הסריקה (הרובוט של גוגל – GoogleBot) בקבוצות (Batches) של דפים, כלומר, שגוגל סרק קבוצה גדולה של דפים, ואז העביר אותם לטיפול והכנסה לתוך האינדקס בתהליך בן מספר שלבים, שחלקם ארך זמן רב יותר מהאחרים (השלב העיקרי בוצע בערך אחת לשבועיים). אמנם מדובר היה בתהליך מתמשך, אך הדפים בקבוצה היו צריכים להמתין עד לטיפול בכל הקבוצה בכדי להמשיך לשלב הבא. האינדקס של גוגל הוא מעין תמונה בזמן של האינטרנט כפי שגוגל מכיר אותו, וככל שלוקח לתוכן זמן רב יותר להגיע אל האינדקס, כך לוקח זמן רב מרגע שגוגל איתר תוכן חדש ועד שהתוכן מופיע בתוצאות החיפוש.
אינדוקס בזמן אמיתי – קפאין
עדכון קפאין משנה בצורה משמעותית את הצורה בה גוגל עובד. במקום תהליך טורי בו רק כאשר הטיפול בקבוצת דפים מסתיים מועברת הקבוצה לשלב הבא בתהליך שעשוי לקחת זמן רב, עדכון קפאין מבצע את הטיפול בדפי האינטרנט (הכנסתם לאינדקס) במנות קטנות ובתהליך מתמשך, מה שמאפשר את הכנסתם של דפים חדשים לאינדקס כמעט מייד עם סריקתם (לעיתים אפילו תוך שניות!).
עדכון קפאין משמעותי ביותר באתרים בהם התכנים הינם תכנים המתרעננים בצורה תכופה (אתרי חדשות, בלוגים, רשתות חברתיות ועוד), שמעתה יוכלו לגרום לתכנים שלהם להופיע בגוגל במהירות רבה מאד. באמצעות העדכון החדש מעריכים אנשי גוגל שרעננות האינדקס שלהם עלתה ב-50%. בנוסך, זמני החיפוש באינדקס החדש אמורים להיות מהירים יותר בצורה משמעותית. בצורה זאת ינסו אנשי גוגל להתחרות במהירות זרימת החדשות העצומה המאפיינת את הרשתות החברתיות המהוות תחרות גדלה והולכת לגוגל.
חשוב להבין – עדכון קפאין הוא עדכון של התשתית של גוגל, והוא אינו עדכון הקשור ישירות לדירוג האתרים בתוצאות החיפוש. בנוסף, חשוב להבין כי העדכון לא מדבר על קצב הסריקה של גוגל (שנשאר זהה), אלא על מהירות הכנסת הדפים שנסרקו אל האינדקס.
מספר נתונים על האינדקס החדש: גודלו של האינדקס הוא כמאה מיליון ג'יגהבייט, ובכל יום נכנסים אליו מאות אלפי ג'יגהבייטים של מידע עדכני.