סיקור מקיף

חוכמת ההמונים והאלגוריתם של גוגל

תופעת גוגל מתפשטת גם לתחום המחקר האקדמי

אבי בליזובסקי

עם חדירת גוגל לארץ, גובר העניין בתופעה יוצאת הדופן הזו. לאחרונה יצא לאור בהוצאת “עברית” בשיתוף הוצאת כתר הספר “חוכמת ההמונים”. מאת הסופר ג'יימס סורובצקי. הספר מביא בין שלל הדוגמאות גם את סיפורה של גוגל: הנה הציטוט (עמ' 34, מאנגלית ג'וד שבא):
“גוגל יצא לדרך ב-1998, בתקופה שנראה שליאהו יש חזקה על עסקי החיפוש – ושאם יאהו יקרטע, אלטה-ויסטה או לייקוס ישארו בזירה, אבל בתוך שנים ספורות גוגל נעשה מנוע החיפוש המועדף על כל משתמשי האינטרנט, פשוט משום שגוגל מוצא את הדף הנכון במהירות רבה יותר. הדרך של גוגל לעשות זאת – סריקה של 3 מיליארד דפי רשת – מבוססת על חוכמת ההמונים.
בגוגל שומרים בסוד את פרטי הטכנולוגיה אבל מגלים כי בלבה של מערכת גוגל נמצא אלגוריתם דירוג העמוד (PageRank), שהוגדר לראשונה על ידי מייסדי החברה, סרגי ברין ולארי פייג' בשנת 1998, במאמר שהוא כיום מיתולוגי שכותרתו “אנטומיה של מנוע חיפוש דפי רשת היפרטסקטואליים בקנה מידה גדול.” האלגוריתם הזה הוא שיטת חישוב שמאפשרת לכל דפי הרשת להחליט אילו מהם רלבנטיים יותר לחיפוש מסויים. הנה הניסוח של גוגל:
PageRank מסתמך על האופי הדמוקרטי הייחודי של הרשת, על ידי שימוש במארג הלינקים העצום שלה כאינדיקטור ל”ערך” של אתר מסוים. בעצם, גוגל מפרש קישור מדף א' לדף ב' כ”קול” של דף א' לדף ב'. אבל גוגלן לא מסתכל רק על כמות ה”קולות” או הקישורים שדף מקבל; הוא גם מנתח את הדף המצביע. קולות מדפים שהם עצמם “חשובים” ערכם גדול יותר והם עוזרים להפוך דפים אחרים ל”חשובים”.” (ועד כאן הציטוט מתוך הספר).

מהי בעצם חוכמת ההמונים – או כפי שיש גם המכנים אותה חוכמת הנחיל (ובין הדוגמאות מהטבע ישנם גם סיפורים על הדרך שבה נחיל דבורים מוצא את שדה הפרחים בעלי הצוף הרב ביותר). בתנאים הנכונים, החלטה שמקבלת קבוצה גדולה עשויה להיות החלטה אינטלגנטית, ולעיתים נבונה יותר מזו של האנשים החכמים בקבוצה. זהו ענף בכלכלה שלא זכה לדעת סורוביצקי לכבוד הראוי לו. התופעה הזו גם נוגדת את האינטואיציה, אך מסתבר שהיא קיימת. באחד מירידי החקלאות במאה ה-19 נתבקשו המבקרים להמר על משקלו של שור. אמנם היו בין המהמרים מגדלי שוורים מקצוענים, ואולי גם אנשים שידעו את התשובה האמיתית אבל רוב האנשים סתם ניחשו. החוקר פרנסיס גלטון סבר שתוצאת הממוצע של ניחוש של מעט חכמים והרבה טפשים תהיה רחוקה מהמציאות אך הופתע מכך שהמשקל היה כמעט מדויק (למעשה הממוצע היה 542.9 ומשקל השור 543.4 ק”ג).
סוג אחר של חוכמת המונים מוכר לכולנו – הבורסה. גם שם יודעים ההמונים מתי להכנס למניה ומתי לצאת ממניה, ברגע שיש שמועות על שינוי כלשהו בחברה. להפך, הבורסות אפילו נוקטות צעדי ענישה כנגד מי שמשתמש במידע פנים. מסתבר שגם ההימורים במועדוני הימורים משקפים לעיתים את התוצאה הסופית (למשל באשר לזכיות באוסקר). בקיצור, ספר מעורר מחשבה.

ביניים: האלגוריתם הוא רק חלק קטן
ובאותו עניין, אורן עציוני, חוקר בתחום מנועי החיפוש מאוניברסיטת וושינגטון בסיאטל, שחתום על שלושה סטארטאפים (אחד מהם ישראלי) הרצה השבוע על מנועי החיפוש העתידיים בפני תלמידים, אנשי סגל ובוגרים במרכז הבינתחומי בהרצליה. בתשובה לשאלתי באשר למנוע של גוגל אמר עציוני: “האלגוריתם המפורסם של גוגל הוא הרבה פחות קובע את האיכות שלהם מאשר אנשים חושבים. החיפוש שלהם מורכב מהרבה פטנטים שהם לא מגלים, מה שברור זה שהאלגוריתם המקורי הוא חלק קטן. למשל גוגל מייחס חשיבות למילים שכתובות בתיאור הדף במקום ממנו מקשרים לדף (
Anchortext) ” כשאתה עושה לינק לדף הבית שלי, תכתוב על זה משהו כמו דף הבית של אורן עציוני. הם גילו שהמילים הקצרות המופיעות על הלינק הם סיכום מעולה של מה שיש בדף המקושר.”
עציוני אומר כי חוזקה של גוגל נובע מכך שבאותה התקופה, האתרים האחרים סברו שחיפוש הוא Commodity ואפילו הוציאו את מנוע החיפוש שלהם באאוטסורסינג, כאשר יאהו, ליקוס ואחרים הפכו את דף הבית שלהם לפורטלים כשהוסיפו חדשות, הורוסקופים וכו'. באה גוגל והשקיעה סכומי עתק במנוע חיפוש וקטפה לפיכך את כל השוק.
עציוני וקבוצה בראשותו חוקרת כעת כיצד להקנות למנועי החיפוש תבונה מלאכותית כדי שיוכלו להבין את התשובה לשאילתה ולמצות אותה מכל דפי האינטרנט שכיום הגולשים מקבלים קישור אליהם. הם צריכים למעשה “להבין” את תכולת הדפים. הוא מעריך שידרשו עוד עשר שנים עד שמנועי החיפוש יוכלו להגיע לתבונה כזו.

ביניים: שאילתה לגוגל ישראל
ושוב באותו עניין: מדוע האלגוריתם החדשותי של גוגל, שאמור לקחת ולרכז ביחד את הידיעות באותו הנושא יוצר איים של 2-3 ידיעות כל אחד? לדוגמה – הידיעות מטקס פרס דן דוד באוניברסיטת תל אביב הופיעו יום לאחר הטקס (22/5) בלפחות שני מקבצים שונים? קודם לכן, עם פטירתו של פרופ' יובל נאמן, כמעט כל הידיעות הופיעו כבודדות?

ידען הספרים

https://www.hayadan.org.il/BuildaGate4/general2/data_card.php?Cat=~~~484948358~~~42&SiteName=hayadan

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.