כיצד פועל מנוע החיפוש גוגל?
מעט רקע
חברת גוגל הוקמה בשנת 1998 על ידי שני דוקטורנטים צעירים בשם לארי פייג' וסרגיי ברין כחלק מפרוייקט אקדמי לניתוח רשת האינטרנט כאשר נושא המחקר השפעת קישורים נכנסים (קישורים הנכנסים לאתר מסוים מאתרים אחרים) על דירוג אתרים במנוע החיפוש. עד אז מרבית מנועי חיפוש, תאמינו או לא, דירגו אתרים על פי כמות הפעמים שבו ביטוי החיפוש מופיע באלמנטים שונים בעמוד.
מסתבר שמנוע חיפוש המבוסס על דירוג אתרים לפי קישורים נכנסים הוא רעיון לא רע בכלל . כבר בתחילת דרכו גוגל נחשב למנוע חיפוש המפיק תוצאות טובות יותר מיתר מנועי החיפוש הקיימים. מאז הדרך אל הצמרת היתה מהירה.
שלבי הפעולה של מנוע החיפוש גוגל
השלב הראשון הוא סריקת (Crawling) הדפים הקיימים ברשת האינטרנט באמצעות יישום שמוכר בשם רובוט (Google Bot) או עכביש. נאמץ את השם עכביש כי הוא מגניב ויוצר רושם שהאתר שלי הוא אתר של קולים.
העכביש סורק את עמודי האתר ועובר בין דפים שונים וגם בין אתרים באמצעות הקישורים שנמצאים על גביהם ומאנדקס אותם, שזה בעצם השלב השני.
השלב השני הוא אחסון הדפים בשרתים של גוגל (Indexing). אלגוריתמים מנתחים את המילים באתרים שהעכביש סרק ומאנדקסים כל מילה שבדף, בין היתר נשמר מידע כגון היכן המילה מופיעה בעמוד ומה מאפייני העיצוב שלה (גודל, הדגשה, צבע וכו'). כל מילה מקבלת ערך מסוים שמושפע ממספר רב של גורמים.
השלב השלישי הוא ניתוח הביטוי שהוזן בשורת החיפוש (Analyzing). הקשה על ENTER שולחת את הביטוי לשרתים של גוגל, שם נמצאים האינדקסים. כל שרת סורק חלק אחר של האינדקס על מנת להעניק מהירות חיפוש מקסימלית. מנוע החיפוש מחפש התאמה בין המושג שהוזן לבין המילים המופיעים באינדקסים ואלגוריתמים ממיינים את עמוד (ולאו דוקא האתרים) הרלבנטיים ביותר לביטוי ומציגים אותה. יותר מכ-100 גורמים משפיעים על דירוג תוצאות החיפוש.
התוצאה הסופית היא כמובן הרשימה המדורגת של אתרים שאנו מקבלים. כל תוצאה מכילה פרטים כלליים על האתר. התוצאות מדורגות לפי האלגוריתמים של גוגל כאשר הסבירות היא שהתוצאה הראשונה הכי מתאימה לערך שהקלדנו.