סיקור מקיף

על הפר השמן ביותר שהציל את כבוד הדמוקרטיה, והציוצים שניבאו את עתיד הבורסה

החציון הניב את התוצאה הקרובה ביותר למשקל השור, קרובה אפילו יותר מזו של כל המומחים לבקר שהשתתפו בתחרות. הממוצע, דרך אגב, היה קרוב עוד יותר.

פר
פר

האיכרים בחנו את העדר בקפדנות, ובחרו את הפר השמן והנאה ביותר. הלז נקשר בצווארו והועמד לראווה על הבמה, שם היה חשוף לעיני כל הקהל בתחרות שפיטת-המשקל שביריד השנתי בפליימות’ שבאנגליה. למעלה משמונה-מאות מתחרים רכשו כרטיסים, במחיר שישה פני האחד, עליהם רשמו את שמם ואת ניחושם למשקל השור. הניחושים המקורבים ביותר למשקל השור זיכו את בעליהם בפרסים יקרי-ערך. וכאן הייתה כל האפיזודה מסתיימת, אילולא נוכחותו בקהל של אחד אנשי המדע הבולטים של המאה ה- 19, פרנסיס גלטון.

“אם ניקח את החציון של הצבעות האנשים, מה תהיה התוצאה?” תהה גלטון. החציון הוא כלי סטטיסטי הדומה בטבעו לממוצע, אך מתעלם מההצבעות הקיצוניות ביותר למעלה ולמטה. כאשר סיכם גלטון את כל ההצבעות וחישב את החציון, הוא הופתע לטובה: החציון הניב את התוצאה הקרובה ביותר למשקל השור, קרובה אפילו יותר מזו של כל המומחים לבקר שהשתתפו בתחרות. הממוצע, דרך אגב, היה קרוב עוד יותר.

גלטון פירסם את התופעה המפתיעה בכתב העת נייצ’ר ב- 1907, תחת השם ‘ווקס פופולי’ – קולם של ההמונים. “קרוב לוודאי שהמשתתף הממוצע בתחרות היה מוכשר בהערכת משקל השור, כפי שמצביע ממוצע מוכשר בהבנת ערכם של רוב הנושאים הפוליטיים עליהם הוא מצביע.” כתב, במידה רבה של צדק. המצביע הבודד אולי אינו חכם או נבון יותר מהממוצע, אבל כאשר משקללים את הצבעותיהם של כלל האזרחים, ניתן לצפות שיגיעו להחלטה קרובה לנכונה. “תוצאה זו, אני חושב, מקנה יותר תוקף לביטחוננו בשיפוט הדמוקרטי משניתן היה לצפות.”

קיים כמובן הבדל גדול בין קביעת משקלו של פר לבין בחירת הפוליטיקאי המתאים ביותר לתפקיד, אך רעיונו של גלטון השתמר ונקבע כ- ‘חכמת ההמונים’. נראה כי במקרים מסוימים מסוגל ההמון להגיע להחלטות ולתובנות עמוקות ומדויקות יותר מאלו של כל אינדיבידואל בפני עצמו.

בימים אלו מראה מחקר חדש כי תחושות ההמון מסוגלות גם לנבא טרנדים ביזאריים יותר מהצבעה למפלגת העבודה, עד כמה שקשה להאמין בכך. סיכום של קרוב ל- 10 מיליון טוויטים (‘ציוצים’ – כינוי להודעה קצרה ברשת החברתית טוויטר) הראה שרמת הרוגע בטוויטו-ספירה יכולה לנבא האם מדד הדאו-ג’ונס יעלה או ירד בימים הקרובים בדיוק של 87.6 אחוזים.

החוקרים בחנו 9.8 מיליון ציוצים, וסיווגו חלק מהם שהביעו רגשות לפי סוג הרגש: רוגע, דריכות, ביטחון, חיות, נדיבות ושמחה. הם חילקו את הציוצים לפי ימים, ויצרו גרף שהראה את רמת כל רגש ציבורי בהתאם לתאריך. השלב הבא היה לבדוק כיצד משתנה כל רגש ציוציבורי בהתאם לתאריכים ספציפיים. החוקרים התרכזו בהתחלה בשלושת הימים הסובבים את יום הבחירות בארצות הברית. ביום שלפני יום הבחירות, צונחת רמת הרוגע, אך היא עולה בחזרה ביום הבחירות עצמו, יחד עם קפיצה משמעותית בדירוג החיות, השמחה והנדיבות. בדיקה נוספת נערכה על יום חג המולד בנובמבר 2008, בו ניתן למצוא עלייה משמעותית בדירוג השמחה בלבד.
תוצאות אלו מאששות את יכולתו של האלגוריתם לנתח את תחושותיה של הטוויטו-ספירה, אך ההפתעה הגדולה הגיעה כאשר ניסו החוקרים להשוות בין מצב הרוח הלאומי לממוצע התעשייתי של הדאו ג’ונס. הם גילו להפתעתם שמדד הרוגע מתואם היטב עם עליות ונפילות שוק ההון, אך מקדים אותן בכמה ימים בכל פעם.

זוהי אינה הוכחה חזקה בפני עצמה, ולכן החליטו החוקרים לנסות ולבדוק האם ניתן להשתמש בטוויטר כדי לנבא את עתיד הבורסה. הם יצרו אלגוריתם שחזה האם מדד הדאו ג’ונס יעלה או ירד לפי ממוצעי הדאו ג’ונס משלושת הימים האחרונים. אלגוריתם זה הצליח לחזות את עתיד השוק בדיוק של 73.3 אחוזים. זה לא רע, אבל כאשר הוזנו לתוך האלגוריתם גם נתוני הרוגע מטוויטר, עלו אחוזי הדיוק עד ל- 86.7 אחוזים.

על אף שהתוצאות נראות מרשימות במבט ראשון, מומלץ להשאר ספקנים. תמיד קיים החשש שהחוקרים קבעו את תוצאות המחקר המצופות מראש, והתאימו את השיטות על מנת להגיע אליהן. החשש גובר עקב העובדה שכותבי המחקר בחרו לפרסם אותו בכתב-עת מקוון – arXiv– שאינו עובר ביקורת רשמית על ידי מדענים אחרים. כתב עת זה נוהג לפרסם בדרך-כלל מאמרים מתמטיים ופיזיקליים, ולכן קשה במיוחד להבין מדוע בחרו החוקרים דווקא בו כמקום לפרסום המחקר. כל אלו מעלים סימני שאלה בנוגע למהימנות התוצאות. כמו תמיד, רצוי לחכות למחקרים נוספים שיאששו את האלגוריתם מהמחקר הנוכחי. ואם יבואו חוקרים אחרים ויפריכו את התוצאות הנתונות?

ובכן, זהו כוחה של חכמת ההמונים.

9 תגובות

  1. מישהו,
    קרוב לודאי שהדמוקרטיה עדיפה על כל דיקטטורה. אבל הטענה שההצבעה המשוקללת של כלל האזרחים צפויה להביא את ההחלטה הקרובה לנכונה שגויה לגמרי. היא אפילו לא מתקרבת לאמת.
    בניגוד להצבעה על עניין קונקרטי כגון משקל הפר, בפוליטיקה יש פתחים ענקיים לשיקולים הזייתיים וסחף עצום של דעת המצביעים.
    כמות הטענות הכוזבות העומדות לשיקולי המצביעים מבטיחה ששקלול דעות המצביעים יעניק את השלטון ברוב המקרים לאנשים לא ראויים.

  2. ככה עובד המשטר באנגליה ובארה”ב מאות
    שנים וככה נבחר אדולף היטלר לקנצלר.

    ההבדל בין התחרות נושאת הפרסים לבין
    הדמוקרטיה הוא, שבתחרות השתתפו אנשים
    שהיו מוכנים לשלם כסף כדי לזכות בפרס,
    כלומר הם הניחו שיש להם ידע בנושא
    (אחרת חלקם אולי לא היה משלם) ווסביר
    לחשוב שזהו המצב. פרט נוסף וחשוב
    הוא, שבבחירות דמוקרטיות אתה בוחר
    אדם שיתמודד עם אירועים עתידיים –
    ולא עם המציאות הקיימת כפי שאתה מכיר
    אותה.
    הטוב שבדמוקרטיה אינו ההשימוש בידע
    המצטבר, אלא עצם שותפות הגורל רעועה
    ככל שתהיהבין המנהיג לאזרחים ובינם לבין
    עצמם.

  3. איזו אופטימיות, עם חכם
    “כפי שמצביע ממוצע מוכשר בהבנת ערכם של רוב הנושאים הפוליטיים עליהם הוא מצביע.” כתב, במידה רבה של צדק. המצביע הבודד אולי אינו חכם או נבון יותר מהממוצע, אבל כאשר משקללים את הצבעותיהם של כלל האזרחים, ניתן לצפות שיגיעו להחלטה קרובה לנכונה. “תוצאה זו, אני חושב, מקנה יותר תוקף לביטחוננו בשיפוט הדמוקרטי משניתן היה לצפות.”

    איזו אופטימיות, איזה עם חכם,
    מה זה החלטה נכונה בפוליטיקה? הישראלים מעולם לא התנגדו ליציאה למלחמה, אבל כל ניסיון לעשות שלום נתקל בהתנגדות של לפחות חצי מהאוכלוסיה, במקרה המוצלח. בדרך כלל הרוב כולל הממשלה התנגדו לשלום.
    עכשיו תחליטו למה אתם מצפים בשעה אופטימית

  4. לגיא:
    אם התפלגות השגיאה היא סימטרית (למשל התפלגות נורמלית עם תוחלת אפס) ולא ידוע שום מידע נוסף על התפלגות המשקל של הפר (prior) אז X זו התשובה הכי טובה שתקבל.

  5. שאלה:

    ישנו ערך מסוים אותו אני רוצה לדעת. נאמר משקלו של פר שמן.
    יש ברשותי משקל ישן שעוזר לי למדוד את המשקל של הפר, אך בגלל שהוא ישן הוא לא מדויק כל כך – המדידות שהוא נותן הן רועשות. נניח שהסיכוי שהמכשיר מעלה ממשקל הפר בכמות מסוימת או מוריד ממשקלו בכמות זו הינו זהה (למשל נאמר שהרעש מתפלג גאוסיינית סביב הערך האמיתי).

    והשאלה היא זו – שקלתי את הפר וקיבלתי מספר כלשהו X.
    מהי ההערכה הטובה ביותר שתהיה לי למשקלו של הפר כאשר אין באפשרותי לבצע עוד שקילה?

  6. חבל לתת הסבר מעורפל ל”חציון”.
    הגדרת החציון בפשטות:
    עבור אוסף ערכים נתון, יש לסדר את הערכים על פי סדר עולה ולקחת את האיבר האמצעי.
    במידה ומספר הערכים זוגי, החציון הוא ממוצע שני הערכים האמצעיים.

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.