סיקור מקיף

לעולם אל תאמרו לעולם לא / דייוויד ג’י האנד

אינכם צריכים להיות מופתעים כשמתרחשים אירועים בלתי סבירים, ניסים ומקרים יוצאי דופן אחרים, אפילו לא כשאותו רצף מספרים זוכה פעמיים רצוף בלוטו

נסים. איור: shutterstock
נסים. איור: shutterstock

קבוצת חוקים מתמטיים שאותה אני מכנה בשם “עיקרון האי-סבירות” מבהירה לנו מדוע אין אנו צריכים להיות מופתעים מהתרחשותם של צירופי מקרים. למעשה, עלינו לצפות לכך שצירופי מקרים שונים אכן יתרחשו. אחד מעמודי התווך שעליו נשען העיקרון הזה הוא “חוק המספרים הגדולים באמת”. חוק זה קובע שבהינתן מספר גדול דיו של הזדמנויות, עלינו לצפות שכל מאורע ייחודי יתרחש, וזאת ללא קשר לסבירות שהוא יתרחש בכל אחת מן ההזדמנויות לבדה. לעתים אנו נוטים לחשוב שמספר ההזדמנויות להתרחשותו של מאורע הוא קטן, בעוד שלמעשה מספר ההזדמנויות גדול במיוחד. תפיסה שגויה זו מובילה אותנו להמעיט מאוד בהסתברות להתרחשותו של המאורע. במקרים כאלה אנו נוטים לחשוב שההסתברות שהמאורע יתרחש מזערית, כשלמעשה הסיכוי שהמאורע יתרחש גבוה למדי, וייתכן אפילו שהאירוע כמעט ודאי.

 

כיצד ייתכן שמספר עצום של מאורעות יתרחש בלי שאנשים יבחינו שהם מתרחשים? “חוק צירופי המאורעות”, שגם הוא אחד מעמודי התווך של עקרון האי-סבירות, יכול להסביר תופעה זו. החוק קובע כך: מספר הצרופים האפשריים של אינטראקציות בין אלמנטים שונים בקבוצה גדל באופן מעריכי (אקספוננציאלי) עם הגידול במספר החברים בקבוצה. בעיית “תאריך יום ההולדת המשותף” היא דוגמה מוכרת לכך.

בעיית תאריך יום ההולדת המשותף היא הבעיה המתמטית הזאת: כמה אנשים צריכים להיות בחדר כדי שהסתברות לכך שיום ההולדת של שניים מהם יחול באותו יום תהיה גבוהה מן ההסתברות שאין צמד אנשים שיום ההולדת שלהם חל באותו יום.

התשובה היא 23 אנשים בלבד. אם מצויים בחדר 23 אנשים ההסתברות שלצמד מהם יהיה אותו תאריך יום הולדת גדולה מההסתברות שלא יימצא צמד כזה.

אם לא הכרתם את בעיית תאריך יום ההולדת המשותף קודם לכן, סביר להניח שהתשובה הזאת הפתיעה אתכם. המספר 23 נשמע קטן באופן חשוד. ייתכן שהדרך שבה הגעתם למסקנה הזאת היא זאת: ההסתברות שלאדם מסוים בחדר יהיה אותו תאריך יום הולדת כמו זה שלי היא אחת ל-365. ההסתברות שלאחד הנוכחים בחדר יהיה תאריך יום הולדת שונה משלי היא אפוא 364/365. אם יש n אנשים בחדר, וההסתברות שלכל אחד מן האנשים האחרים, שמספרם n-1, יש יום הולדת בתאריך שונה משלי היא 364/365, אז ההסתברות שתאריך יום ההולדת של כולם הוא תאריך שונה משלי היא 364/365 × 364/365 ×364/365 ×364/365 … × 364/365, כלומר, מכפלה של 364/365 בעצמו n-1 פעמים. אם n שווה 23, התוצאה היא 0.94.

מכיוון שזוהי ההסתברות שלאיש מהם אין יום הולדת בתאריך שלי, ההסתברות שלפחות לאחד מהם תאריך יום הולדת כמו שלי היא 1-0.94 (זה נובע באופן ישיר מן העבודה שיש רק שתי אפשרויות: או שלאחד האנשים יש יום הולדת בתאריך שלי, או שלשום איש מהם אין יום הולדת בתאריך שלי, לכן סכום ההסתברויות חייב להיות 1). אבל, 1-0.94 שווה ל-0.06. זוהי הסתברות נמוכה מאוד.

אבל החישוב הזה שגוי מפני שלא התבקשתם לחשב את ההסתברות הזאת, כלומר את ההסתברות שלאחד הנוכחים בחדר יהיה אותו תאריך יום הולדת כמו שלכם. השאלה הייתה מהי ההסתברות שלאחד מן הנוכחים בחדר יש יום הולדת בתאריך של אדם אחר כלשהו הנוכח בחדר, כלומר צמד אנשים החוגגים יום הולדת באותו תאריך. החישוב הזה אמנם כולל את ההסתברות שלמישהו בחדר יהיה יום הולדת בתאריך שלכם, שהיא ההסתברות שחישבנו למעלה, אבל היא כוללת גם את ההסתברות שלשני אנשים אחרים בחדר, או יותר, יהיה יום הולדת בתאריך זהה, גם אם הוא שונה מזה שלכם.

זהו השלב שבו מספר הצירופים האפשריים נכנס לפעולה. בעוד שיש רק n-1 אנשים שונים בחדר שיום הולדת שלהם עשוי להיות בתאריך זהה לזה שלכם, יש בחדר בסך הכול n×(n-1)/2 צמדים שונים של אנשים. מספר הצמדים האפשריים גדל באופן מהיר ככל שמספר האנשים בחדר (n) גדל. כשבחדר יש 23 אנשים, מספר הצמדים האפשריים הוא 253, יותר מפי 10 מן המספר n-1=22. כלומר, כשבחדר נוכחים 23 אנשים, יש בו 253 צמדים שונים אפשריים, אבל רק 22 מהם כוללים אתכם.

כעת ניגש לחישוב ההסתברות שאין בחדר אף צמד אנשים בעלי תאריך יום הולדת משותף. ההסתברות שלשני אנשים יש יום הולדת בתאריך שונה זה מזה היא 364/365. ולכן, ההסתברות שלשניהם ימי הולדת בתאריכים שונים ובנוסף, יש בחדר אדם שלישי שיום ההולדת שלו שונה מזה שלהם היא 363/365 × 364/365. באופן דומה, ההסתברות שלשלושתם ימי הולדת בתאריכים שונים ובנוסף לכך, גם יום ההולדת של אדם נוסף, רביעי, חל בתאריך רביעי היא 362/365 × 363/365 ×364/365. אם נמשיך בדרך זו נמצא שההסתברות שאין בחדר שני אנשים החוגגים את יום ההולדת שלהם באותו תאריך היא: 362/365 ×363/365 ×364/365 … ×343/365. ההסתברות הזאת שווה ל-0.49. לכן, ההסתברות שכמה מהם הם בעלי תאריך יום הולדת זהה היא 1-0.49, או במילים אחרות, 0.51, מספר גדול מחצי.

לזכות בלוטו

נפנה כעת לדוגמה נוספת של מאורעות שהסתברות להתרחשותם נראית נמוכה אף על פי שהיא גבוהה: הגרלות לוטו. ב-6 בספטמבר 2009 עלו בהגרלת הלוטו הבולגרי באופן אקראי המספרים 4, 15, 23, 24, 35 ו-42. אין שום דבר מפתיע בסדרת המספרים הזאת. אמנם כל הספרות במספרים האלה נמוכות, 1, 2, 3, 4 ו-5, אבל זה איננו מיוחד כל כך. בנוסף, הסדרה כוללת זוג מספרים עוקבים, 23 ו-24. אך זה מתרחש בתדירות גבוהה הרבה יותר ממה שבדרך כלל מקובל לחשוב (למשל, כשמבקשים מאנשים לבחור באופן אקראי שישה מספרים בין 1 ל-49, הם בוחרים מספרים עוקבים בתדירות נמוכה יותר מזו של בחירה אקראית אמיתית).

הדבר המפתיע התרחש ארבעה ימים מאוחר יותר. ב-10 בספטמבר עלו בגורל בהגרלת הלוטו הבולגרי המספרים 4, 15, 23, 24, 35 ו-42, בדיוק אותם מספרים שעלו בגורל שבוע קודם לכן. תוצאות ההגרלה עוררו בזמנו כעין סערה תקשורתית. “זאת הפעם הראשונה ב-52 שנות קיומו של הלוטו שדבר כזה מתרחש. אנחנו המומים מצירוף המקרים המוזר הזה, אבל זה מה שבאמת קרה,” כך צוטט דובר הלוטו הבולגרי בכתבה של סוכנות העיתונות רויטרס ב-18 בספטמבר. שר הספורט של בולגריה באותה עת, סבילן נייקוב, הורה על פתיחת חקירה. האם ייתכן שמדובר בהונאה מתוחכמת? האם העתיקו את המספרים בדרך כלשהי?

למעשה, צירוף המקרים המדהים הזה הוא רק דוגמה נוספת של עקרון האי-סבירות, או במילים אחרות, פעולתו של חוק המספרים הגדולים באמת מתוגבר בחוק הצירופים. ראשית כול, ברחבי העולם נערכות הרבה מאד הגרלות לוטו. שנית, ההגרלות נערכות פעם אחר פעם ברציפות במשך שנים רבות. ולכן, בסך הכול יש הזדמנויות רבות מאוד לכך שמספרי הלוטו יחזרו על עצמם. שלישית, חוק הצירופים נכנס לפעולה. בכל פעם שסדרת מספרים כלשהי עולה בגורל בהגרלת לוטו היא עשויה להיות זהה לסדרת מספרים אחרת שכבר עלתה בגורל בהגרלת לוטו כלשהי שנערכה בעבר. באופן כללי, אם התרחשו n הגרלות לוטו, יש n×(n-1)/2 זוגות של הגרלות לוטו שיכולים להכיל את אותה סדרת מספרים.

הגרלת הלוטו הבולגרי שחזרה על עצמה ב-2009 היא הגרלה של שישה מספרים מתוך 49. לפיכך, ההסתברות של סדרת מספרים כלשהי לעלות בגורל היא אחת ל-13,983,816. כלומר, הסיכוי שבצמד הגרלות לוטו מסוים תעלה בגורל סדרת מספרים זהה לזו של הגרלת לוטו כלשהי אחרת הוא אחת ל-13,983,816. אך מה בדבר הסיכוי שבשתי הגרלות כלשהן מבין שלוש הגרלות לוטו תעלה בגורל סדרת מספרים זהה? או מבין 50 הגרלות לוטו?

בכל שלוש הגרלות יש שלושה צמדי מספרים, אבל ב-50 הגרלות שונות יש 1,225 צמדים אפשריים. חוק הצירופים נכנס אפוא לפעולה. אם נמשיך, נמצא כי ב-1,000 הגרלות לוטו שונות יש 499,500 צמדים שונים. במילים אחרות, אם נכפיל את מספר ההגרלות פי 20, מ-50 הגרלות ל-1,000 הגרלות, העלייה במספר הצמדים של הגרלות לוטו שונות תהיה חדה הרבה יותר: הוא יוכפל פי 408 ויעלה מ-1,225 ל-499,500. אנחנו נכנסים לתחומם של המספרים הגדולים באמת.

כמה הגרלות לוטו צריכות להתרחש כדי שההסתברות שאותה סדרת מספרים תעלה בגורל פעמיים תהייה גדולה מ-0.5? כלומר ששהסבירות שהדבר יתרחש תהיה גבוהה מן הסבירות שהוא לא יתרחש? בעזרת אותה שיטה שבה ניתחנו את בעיית תאריך יום ההולדת המשותף אפשר לגלות שהתשובה היא 4,404 הגרלות.

אם נערכות שתי הגרלות לוטו בכל שבוע, כלומר 104 הגרלות בשנה, יידרשו פחות מ-43 שנים כדי להגיע למספר הזה. כלומר, לאחר 43 שנה, ההסתברות שבשתי הגרלות כלשהן יעלו בגורל שתי סדרות זהות של מספרים תהיה גדולה מן ההסתברות שהמאורע לא יתרחש. זה מציג באור שונה לגמרי את הודעת דובר הלוטו הבולגרי שזה היה צירוף מקרים מוזר ביותר!

אבל זה החישוב רק לגבי הגרלות לוטו במדינה אחת. אם מביאים בחשבון את מספר הגרלות הלוטו בכל רחבי העולם מוצאים שלמעשה עלינו להיות מופתעים אם לא יוגרלו מדי פעם סדרות מספרים זהות בהגרלות לוטו שונות. לכן, לא תופתעו לדעת שבהגרלת מפעל הפיס הישראלי שנערכה ב-16 באוקטובר 2010, עלתה בגורל סדרת המספרים, 13, 14, 26, 32, 33, ו-36, שעלתה בגורל גם כמה שבועות קודם לכן, ב-21 בספטמבר. אתם לא תופתעו מכך, אבל לאחר ההגרלה הציפו פונים את תחנות הרדיו בישראל בטענה שתוצאות ההגרלה נקבעו מראש.

המקרה של הגרלת הלוטו הבולגרית היה חריג בכך שהסדרות הזהות עלו בגורל בשתי הגרלות עוקבות. אבל חוק המספרים הגדולים באמת, בצירוף העובדה שברחבי העולם מתקיימות הגרלות לוטו רבות זו אחר זו, מראים לנו שאין אנו צריכים להיות מופתעים במיוחד. לכן, בוודאי לא תוכו בתדהמה מכך שהדבר התרחש כבר לפני כן. למשל, בהגרלת הלוטו של צפון קרוליינה, קאש 5, עלתה בגורל אותה סדרת מספרים ב-9 וב-11 ביולי 2007.

דוגמה נוספת, מתסכלת במידה כלשהי, לדרך שבה חוק הצירופים יכול לגרום להתאמה בין הגרלות לוטו שונות הוא המקרה שקרה למורין וילקוקס ב-1980. היא רכשה כרטיסים שהכילו את המספרים הזוכים הן בהגרלת הלוטו של מסצ’וסטס והן בזו של רוד איילנד. לצערה, המספרים בכרטיס ממסצ’וסטס הכילו את המספרים הזוכים בהגרלה של רוד איילנד, ולהפך. כשאדם רוכש 10 כרטיסים להגרלות לוטו שונות הוא מכפיל את סיכויי הזכייה שלו פי 10. אבל עשרה כרטיסים משמעותם 45 צמדים שונים של כרטיסים והגרלות. לכן, ההסתברות שאחד מן הכרטיסים יכיל את הסדרה הזוכה באחת מבין ההגרלות גבוהה יותר מפי 4 מן ההסתברות שיזכה בלוטו. מסיבות ברורות אין זה מתכון לזכייה בהון עתק. התאמה של כרטיס של הגרלת לוטו אחת עם המספרים הזוכים בהגרלת לוטו אחרת אינם מזכים אתכם בשום תמורה, חוץ מאשר בהרגשה שהיקום לועג לכם.

חוק הצירופים חל במקרים שבהם מספר גדול של עצמים או אנשים מקיימים יחסי גומלין זה עם זה. ניקח לדוגמה כיתה של 30 תלמידים. הם יכולים לקיים יחסי גומלין זה עם זה בדרכים רבות ושונות. הם יכולים לעבוד כיחידים, ואז יש רק אפשרות אחת לחלק אותם ל-30 קבוצות. הם יכולים לעבוד בזוגות, ואז יש 435 זוגות אפשריים שונים. הם יכולים לעבוד בשלשות, ואז יש 4,060 אפשרויות שונות. וכן הלאה, עד, כמובן, לאפשרות שבה כולם עובדים במשותף, ואז יש רק אפשרות אחת לחלק אותם.

בסך הכול, מספר הקבוצות האפשריות ש-30 התלמידים יכולים ליצור הוא 1,073,741,823 – יותר ממיליארד. באופן כללי אם קבוצה מכילה n איברים אפשר ליצור ממנה 2n-1 תת-קבוצות. אם n=100, התוצאה היא 2100-1, מספר ששווה בערך ל-1030, לכל הדעות מספר גדול באמת.

אבל אפילו אם 1030 איננו מספר גדול דיו בעיניכם, חשבו על ההשלכות של החוק על רשת האינטרנט שיש לה כיום יותר מ-2.5 מיליארדי משתמשים, שכל אחד מהם יכול באופן עקרוני לתקשר אם כל אחד אחר. הדבר מסתכם ב-3X1018 זוגות אפשריים, וב-10750,000,000 קבוצות אפשריות. אפילו מאורעות בעלי הסתברות קטנה במיוחד הופכים להיות כמעט ודאיים אם מספקים להם מספר רב כל כך של הזדמנויות להתרחש.

אז בפעם הבאה כשאתם נתקלים במשהו שנראה כצירוף מקרים חריג ומוזר, זִכְרו את עקרון האי-סבירות.

__________________________________________________________________________________________________________________________________________________________________

בקיצור

פעמים רבות אנו נוטים לייחס הסתברות נמוכה מאד למאורעות שלמעשה מתרחשים סביבנו כל הזמן. החוק המתמטי של המספרים הגדולים באמת, וחוק הצירופים של מאורעות עוזרים להסביר תופעה זו.

די בכך שבחדר יהיו 23 אנשים בכדי שההסתברות לכך שיום ההולדת של שניים מהם יחול באותו תאריך תהייה0.51. כלומר, גדולה מ-50%.

בלוטו הבולגרי עלו בגורל ב-6 בספטמבר 2009 באופן אקראי סדרת המספרים 4, 15, 23, 24, 35 ו-42. לאחר ארבעה ימים עלו בגורל אותם שישה מספרים בדיוק. בהגרלת הלוטו של צפון קרוליינה, קאש 5, הוגרלו אותם מספרים ב-9 וב-11 ליולי 2007. מוזר? לא על פי תורת ההסתברות.

זכויות יוצרים

מעובד מן הספר “עקרון האי-סבירות: מדוע צירופי מקרים, ניסים ומקרים נדירים מתרחשים בכל יום”, מאת דייוויד ג’י האנד, בהסכמת הוצאות הספרים סיינטיפיק אמריקן/פראר, שטראוס וג’ירו בע”מ (צפון אמריקה), טרנסוורלד (בריטניה), אמבו/אנתוס (הולנד), ס’ ה’ בק (גרמניה), קומפניה דס לטראס (ברזיל), גרופה וידאוניצ’זה פוקסאל (פולין), לוקוס (טייוואן), AST (רוסיה). כל הזכויות שמורות דייוויד ג’י האנד © 2014.

על המחבר

דייוויד ג’י האנד (Hand) הוא פרופסור אמריטוס למתמטיקה וחוקר בכיר באיפריאל קולג’ בלונדון. בעבר שימש כנשיא החברה המלכותית לסטטיסטיקה. הוא מחברו של הספר: סטטיסטיקה, הקדמה קצרה ביותר (הוצאת אוניברסיטת אוקספורד 2008).

עוד בנושא

Duelling Idiots and Other Probability Puzzlers. Paul J. Nahin. Princeton University Press, 2000.

Symmetry and the Monster: One of the Greatest Quests of Mathematics. Mark Ronan. Oxford University Press, 2006.

נס ברחוב ההסתברות, מייקל שרמר, קולו של הספקן, סיינטיפיק אמריקן ישראל, אוקטובר 2013

הכתבה התפרסמה באישור סיינטיפיק אמריקן ישראל

 

3 תגובות

  1. תיקון:
    “ההסתברות שלאדם מסוים בחדר יהיה אותו תאריך יום הולדת כמו זה שלי היא אחת ל-365” ??
    ממש לא !
    תאריך הלידה של אנשים אחרים (אם אינם קשורים אליי בדרך זו או אחרת) אינו מושפע בשום אופן מתאריך הלידה שלי.
    כל הנוכחים אמנם נולדו במסגרת 365 הימים של השנה, אבל אין שום הכרח שיולדו באותה שנה או שתאריכי הלידה של שאר הנוכחים יהיו שונים זה מזה וכך יגבילו את כמות האופציות.
    למעשה, ההסתברות שמישהו מהנוכחים נולד בתאריך שלי היא: (1*365-365*365) * (כל השנים שבהם נולד כל אחד מהנוכחים).
    כך שההסתברות המינימלית שיכולה להיות היא: 1/(365*364) = 1 ל-132,860.
    וההסתברות המקסימלית היא 1 ל-132,860*מספר הנוכחים.
    (הסתברות זו מציגה מצב בו כל אחד מהנוכחים נולד בשנה אחרת).
    מי לימד את הפרופסור הזה מתמטיקה ???

  2. “ההסתברות שלאדם מסוים בחדר יהיה אותו תאריך יום הולדת כמו זה שלי היא אחת ל-365” ??
    ממש לא !
    תאריך הלידה של אנשים אחרים (אם אינם קשורים אליי בדרך זו או אחרת) אינו מושפע בשום אופן מתאריך הלידה שלי.
    כל הנוכחים אמנם נולדו במסגרת 365 הימים של השנה, אבל אין שום הכרח שיולדו באותה שנה או שתאריכי הלידה של שאר הנוכחים יהיו שונים זה מזה וכך יגבילו את כמות האופציות.
    למעשה, ההסתברות שאיש מהנוכחים לא נולד בתאריך שלי היא: (1*365-365*365) * (כל השנים שבהם נולד כל אחד מהנוכחים).
    כך שההסתברות המינימלית שיכולה להיות היא: 1/(365*364) = 1 ל-132,860.
    וההסתברות המקסימלית היא 1 ל-132,860*מספר הנוכחים.
    (הסתברות זו מציגה מצב בו כל אחד מהנוכחים נולד בשנה אחרת).
    מי לימד את הפרופסור הזה מתמטיקה ???

  3. אם לסכם את המאמר במשפט קצר הרי ניתן לאמר כך :
    גם תוצאה הנראית כנדירה במיוחד עשויה להתרחש בסבירות גדולה מ 0.5
    אם מספר האירועים ואם מספר המשתתפים הנם מספיק גדולים.
    בהקשר זה יש לשים דגש כי בכדי שחוק המספרים הגדולים יתקיים, על המשתתפים
    להיות חסרי זהות.
    אם לכל משתתף זהות עצמית יחודית אזי חוק המספרים הגדולים לא יתקיים.
    למשל: מה הסיכוי שמישהו יזכה בלוטו ? נניח בערך כ 2\1, 3\1, 4\1, הרי ישנם מליוני משתתפים.
    לעומת זאת: מה הסיכוי שמר א.בן נר יזכה בלוטו? בערך 14.000.000\1 כי א.בן נר הוא משתתף יחיד. וכמו שאני מכיר את א.בן נר ואת מזלו, סיכויו אף קטן מכך.

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.