פרדוקס שתי המעטפות: איזו רווחית יותר?

מהי האסטרטגיה הנכונה כאשר יש לבחור בין שתי מעטפות זהות ואטומות, שאחת מהן מכילה סכום כסף כפול מהאחרת, אם אנו רשאים לשנות את דעתנו לאחר הבחירה הראשונה?

מריוס כהן, מגזין “גלילאו”

הפרדוקס: מוגשות לנו שתי מעטפות זהות בצורתן, שתיהן סגורות ואטומות, כך שאי-אפשר לראות את תוכנן, ועלינו לבחור אחת מהן. נאמר לנו שבכל מעטפה יש סכום כסף מסוים, והסכום שבאחת המעטפות (לא נאמר לנו באיזו) כפול מהסכום שבמעטפה האחרת (נניח גם שהכסף הוא בצורת צ'ק, כך שהמעטפות זהות גם במשקלן ובנפחן).

מאחר שאי-אפשר לדעת כמה כסף יש בכל אחת מהמעטפות, בחירתנו באחת מהן היא אקראית. ואולם, מיד לאחר שבחרנו באחת המעטפות מוצעת לנו האפשרות להחליף ביניהן, כלומר, להחזיר את המעטפה שבחרנו ולקבל במקומה את המעטפה האחרת, שבה יש, כמובן, או סכום כסף כפול מזה שברשותנו כעת, או רק מחצית מסכום זה. האם כדאי לנו לבצע את ההחלפה או להישאר בבחירתנו הראשונית?

לכאורה נראה, שמבחינת הסיכוי לזכות במרב הכסף אין זה משנה אם נישאר בבחירתנו הראשונית או נחליף מעטפות, שהרי אין שום הבדל חיצוני ביניהן. כמו כן יכולנו באותה מידה לבחור תחילה דווקא במעטפה האחרת, ולקבל את האפשרות להחליף אותה בזו שבחרנו בפועל.

מצד אחר, נניח שסכום הכסף במעטפה הראשונה שבחרנו הוא A שקלים. סכום הכסף במעטפה האחרת הוא אם כן או 2A שקלים, או A/2 שקלים, כך שהחלפה בין המעטפות תביא או לרווח של A שקלים או להפסד של A/2 שקלים, ונראה, אם כן, שהחלפת המעטפות דווקא תהיה אסטרטגיה טובה (אם יש באפשרותנו לוותר על 100 שקל ובתמורה לקבל או 50 שקל או 200 שקל, נראה שהסיכון להפסד קטן מצדיק את הסיכוי לרווח גדול).

למכירים את מושג התוחלת, הרי הצעה לחישוב כדאיות ההחלפה: מאחר שהסכום במעטפה האחרת הוא או 2A או A/2 בהסתברות שווה (על פניו נראה שאין סיבה להניח סיכוי גבוה יותר דווקא לאחת משתי האפשרויות), הרי שתוחלת הסכום שיהיה בידינו לאחר ההחלפה היא:

 וזאת לעומת A שקלים שעומדים לרשותנו כרגע. משמעות חישוב התוחלת היא, שאם יוצע לנו לחזור על המשחק מספר רב של פעמים, ובכל פעם נבחר באסטרטגיית ההחלפה, בסופו של דבר נצבור 25% יותר כסף מאשר אם נבחר באסטרטגיית אי-ההחלפה (אם נוותר על 100 שקל 10 פעמים, ובמקומן נקבל, נניח, 5 פעמים 50 שקל ו-5 פעמים 200 שקל, הרי שתמורת 1,000 השקל שוויתרנו עליהם נקבל 1,250 שקל).

כדי לחדד מעט את ניסוי המחשבה הזה, נניח שהסכום שבאחת המעטפות גדול פי 100 מהסכום שבמעטפה האחרת. במקרה כזה נראה שהחלפת המעטפות מעמידה את הסיכוי להרוויח 99A שקלים ביתרון ברור מול הסיכוי להפסיד 0.99A שקלים (אם A הוא, נניח, 1, אזי אנחנו מסתכנים בהפסד של 99 אגורות מהשקל שבידינו תמורת הסיכוי להרוויח 99 שקלים).

אבל שוב, הרי המעטפות זהות לחלוטין, ובאותה מידה יכולנו לבחור בפעם הראשונה גם במעטפה האחרת, ואם כדאי להחליף מעטפה א' במעטפה ב', אין זה סביר שכדאי להחליף גם את מעטפה ב' במעטפה א'. כמו כן, אם תוצע לנו שוב האפשרות להחליף בין המעטפות (לאחר שכבר החלפנו ביניהן פעם אחת), הרי שלפי שיקולי אסטרטגיית ההחלפה הדבר יהיה שוב כדאי. אבל החלפת המעטפות פעמיים הרי שקולה לאי-החלפתן כלל! אז האם כדאי להחליף בין המעטפות או שאין בהחלפה כזו שום יתרון?
את הפרדוקס הזה הציג ב-1989 בארי ניילבוף (Nalebuff), מומחה לתורת המשחקים מבית-הספר לניהול של אוניברסיטת ייל, שביסס את הפרדוקס על רעיון דומה של המתמטיקאי הבלגי מוריס קרייצ'יק (Kraitchik) מ-1953.

נקודות למחשבה

אחת ההנחות שהביאה לקבלת אסטרטגיית ההחלפה היתה, שלאחר שכבר בחרנו באחת המעטפות, ההסתברות שסכום הכסף במעטפה האחרת יהיה כפול מזה שבמעטפה שבחרנו שווה להסתברות שסכום הכסף במעטפה זו יהיה רק מחצית ממנו. האם זה באמת כך? הניחו שהסכומים בשתי המעטפות הם 100 ו-200 שקל. אם בחרתם במעטפה שבה 100 השקלים (מבלי לדעת זאת), הרי שבמעטפה האחרת יש סכום כפול מזה; ואולם, אם בחרתם במעטפה שבה 200 השקלים, אזי במעטפה האחרת יש אמנם רק מחצית מסכום זה, אבל אין זה אותו סכום בשני המקרים: אם במעטפה האחרת הסכום הוא כפול, הרי שהוא כפול מ-100 שקל, אך אם הסכום בה הוא רק מחצית, הרי שזו מחצית מ-200 שקל!

ההנחה העיקרית שהביאה לדחיית אסטרטגיית ההחלפה היתה ששתי המעטפות זהות לחלוטין, ולכן החלפה בין המעטפות שקולה למעשה לבחירה ראשונית שונה, ונראה שלא אמור להיות הבדל מבחינת סיכויי הזכייה אם נבחר במעטפה זו או אחרת. כמו כן, נניח ששתי המעטפות נמסרות לשני אנשים שונים. אם אסטרטגיית ההחלפה היא האסטרטגיה הנכונה, הרי ששני האנשים יהיו מעוניינים להחליף ביניהם את המעטפות, אבל לא ייתכן שהחלפה כזו תהיה כדאית לשניהם! שיקולים מעין אלו נקראים שיקולי סימטריה, ויש בהם הרבה מאוד כוח שכנוע. האם הסימטריה בין שתי המעטפות היא סיבה מספקת לדחות את אסטרטגיית ההחלפה?

פתרון הפרדוקס

אסטרטגיית ההחלפה הוצדקה לעיל על בסיס השיקול הזה: אם סכום הכסף במעטפה הראשונה שבחרנו הוא A שקלים, הרי שסכום הכסף במעטפה האחרת הוא או 2A שקלים או A/2 שקלים, ולכן החלפה בין המעטפות תביא באותה הסתברות או לרווח של A שקלים או להפסד של A/2 שקלים.

אולם זוהי הצגה מטעה של מצב העניינים. למעשה מוגשות לנו שתי מעטפות, שבאחת מהן יש A שקלים ובאחרת – 2A שקלים. אם באקראי בחרנו במעטפה שבה יש A שקלים, ונבחר להחליף אותה במעטפה האחרת, נרוויח A שקלים, אך אם בחרנו במעטפה שיש בה 2A שקלים, הרי שהחלפה בין המעטפות תסתיים בהפסד של A שקלים! (או, אם הסכומים במעטפות הם A שקלים ו-100A שקלים, הרי שהסיכוי שלנו להרוויח 99A שקלים עומד מול הסיכוי שלנו להפסיד גם כן 99A שקלים).

מכאן שהסכום שאנו עשויים להרוויח שווה לסכום שאנו עלולים להפסיד, כך שאין זה משנה אם נישאר בבחירתנו המקורית או נחליף בין המעטפות. דרך ההצגה הקודמת של הרווח מול ההפסד האפשריים היתה נכונה לו נמסרה לנו מעטפה עם כסף (נאמר 100 שקל), ורק לאחר מכן הושם במעטפה אחרת באותה סבירות או סכום כסף כפול מזה או רק מחצית מהסכום, ואז הוצע לנו לבצע את ההחלפה. או-אז, לו החלפנו בין המעטפות היינו יכולים לקבל במקום 100 השקלים 200 שקל או 50 שקל בהסתברות שווה, והרווח האפשרי היה גדול מההפסד האפשרי, מה שהיה מצדיק את ההחלפה. אולם כפי שראינו, לא אלו הם חוקי המשחק.

 מבחינת שיקולי התוחלת, הרי שאם אנו נשארים בבחירה המקורית, תוחלת הסכום שברשותנו מחושבת על בסיס העובדה שהסיכוי שבמעטפה שבחרנו יש A שקלים שווה לסיכוי שיש בה 2A שקלים:

אם נחליף בין המעטפות, התוחלת החדשה תהיה למעשה שווה לזו הישנה:

 (רק סדר המחוברים התחלף), מה ששוב מוכיח, שאין זה משנה אם נישאר בבחירה הראשונית שלנו או נחליף בין המעטפות (כצפוי משיקולי הסימטריה). לעומת זאת, חישוב התוחלת שהוצג בתחילה מתאים לתסריט השני, שבו סכום הכסף הוכנס למעטפה האחרת רק לאחר שבחרנו באחת המעטפות, עם הסתברות שווה לסכום כפול או למחצית מזה שבמעטפה הראשונה.

לקינוח

נניח שהוצע לכם להשתתף במשחק מעין זה, ולפני שהוצעה לכם אופציית ההחלפה הורשיתם להציץ בסכום שהונח במעטפה שבחרתם (אך לא הורשיתם להציץ במעטפה האחרת, שבה סכום הכסף הוא או כפול או מחצית מזה שבידכם). האם אז היו שיקוליכם שונים? נניח שהגעתם למסקנה שבתנאים כאלו ההחלפה היא כן כדאית. אבל אז גם כשלא הורשתם לפתוח את המעטפה יכולתם להשתמש בידיעה שלו פתחתם אותה הייתם בוחרים להחליף בין המעטפות, ועל בסיס מידע זה לבחור באסטרטגית ההחלפה (שכפי שראינו לעיל אינה מוצדקת).

כמו כן, איך עשוי הממד הפסיכולוגי, שאינו רלוונטי לבעיה המקורית, להשפיע על החלטתכם בתנאי המשחק החדשים? האם תהיו מוכנים לסכן 999 שקלים מתוך 1000 תמורת הסיכוי להפוך למיליונרים? (אם, למשל, מצאתם במעטפה צ'ק על-סך 1000 שקל, ונאמר לכם שבאחת המעטפות סכום הכסף גדול פי 1000 מאשר במעטפה השניה), או האם תהיו מוכנים לסכן את הזדמנות חייכם להיות מיליונרים (אם הצ'ק שמצאתם הוא על-סך מיליון שקל) תמורת הסיכוי להפוך למיליארדרים?

פורסם במקור במגזין “גלילאו”

17 Responses

  1. בתגובה שלי לכתבה “אל האינסוף ומעבר לו” נתתי את ההגדרה המדויקת לפרדוקס- טיעון לוגי ההופך למשהו לא הגיוני בגלל השגיאות העצומות בצורת החשיבה של בני האדם. אני לא אומר שכולנו פה מוגבלים מוחית, אבל אף אחד לא מושלם. תחשבו שנייה: מה יקרה ביקום אם תימצא סתירה לוגית שאין לה פתרון? פשוט זה לא יקרה. ומה אם זה כן יקרה? כפי שאתם מבינים, אפשר להמשיך בשיחה המשעממת הזאת עוד ועוד. אז פשוט נניח לזה.

    אני דווקא יכול בקלות להפריך את הפרדוקס הזה, בעזרת כמה עובדות והגדרות (בטח תבינו איך זה מפריך את הפרדוקס..)

    א. תוחלת זה משהו שפועל רק על מספר גדול מאוד של ניסוייםמשחקיםוכו’, ככל שהמספר גדול יותר זה יותר קרוב לתוחלת.
    ב. אם יש 2 דברים זהים זה לזה מבחינתנו, אז מבחינתנו אפשר להפיק משניהם אותה כמות רווח (או הפסד).
    ג. אסור (במתמטיקה, זה לא שתיענש על כך, אני מקווה) לערבב בחישוב אחד בלבד (מעין “תרגיל שרשרת”) תוחלת וממוצע רגיל.

    ואגב- הפתרון שאני הכי מזדהה איתו: עושים פשוט חצי E כפול 2 E בשורש, וזה כמובן יוצא E (מדוע? שאלה למחשבה).

  2. למדן:
    אתה צודק.
    אני מכיר את הדברים האלה ולצערי המחבר כלל לא התייחס לפתרון הפרדוקס.
    כפי שאמרתי בהזדמנויות אחרות – פתרונו של פרדוקס הוא הצבעה על הטעות בשיקול המביא למסקנה השגויה ולא על ידי הצגת דרך פתרון אחרת שמביאה לפתרון נכון.
    כאן, כפי שציינת, הבעיה היא בעצם ההנחה שיש פונקצית התפלגות הנותנת סיכוי שווה לכל מספר על ציר המספרים בשעה שכל מי שמבין בעניין יודע שלפונקצית התפלגות כזאת לא יכולה להתקיים כי האינטגרל של כל פונקצית התפלגות הוא אחד.
    אני יודע, כמובן גם מה האסטרטגיה אבל מכיוון שרצית שאנשים יחשבו עליה לא אפרטה בשלב זה. מסופקני, לאור התגובות שעלו עד כה אם מישהו בכלל מבין על מה אנחנו מדברים (זו הסיבה שנמנעתי מתגובה עד כה למרות שראיתי את הכתבה בעבר והבחנתי בשגיאות שבה)

  3. הבעייה מוכרת וורסיה שלה פורסמה עם פתרונה בסיינטיפיק אמריקן בשנת 1985 אם איני טועה.
    הפרדוקס הוא הרבה יותר עמוק משאלת הרווח מול הפסד, ועוסק בעצם בשאלה "האם קיימת התפלגות הסתברות אחידה על טווח אינסופי וברור שאין התפלגות כזאת".
    לגבי הפיתרון בפועל, בהנחה שאתה רואה את הסכום במעטפה הראשונה, יש אסטרטגיה שבתוחלת נותנת יותר מ- 50% לכך שלאחר שתחליט אם תחליף תישאר עם המעטפה בעלת הסכום הגדול יותר.
    הנ"ל נכון אם באחת המעטפות יש סכום כפול מבראשונה, וגם כאשר יש סתם שתי מעטפות כשבאחת יש סכום גדול יותר.
    מפתיע עוד יותר לגלות שגם אם אסטרטגיית ההחלפה מפורסמת, והסכומים בשני המעטפות נבחרים כך שמצמצמים ככל שניתן את יעילות האסטרטגיה, עדיין בתוחלת האסטרטגיה של מקבל המעטפות יעילה ביותר מ- 50%.
    רמז למתעניינים – המדובר באסטרטגיה הסתברותית.

  4. השאלה היא – איך תרגיש אחר כך

    הבחירה הראשונה היא מזל
    הבחירה השניה היא חמדנות

  5. פשוט מאוד ! למה לסבך עיניינים ?

    50% לכ כיוון לכן:
    A*0.5 + B*0.5= סה"כ רווח !

    כלומר נניח ש A=1 ו B=999 לכן :

    רווח = 0.5+499.5 = 500

    וכנ"ל לכיוון השני .

    בגדול הרווח הממוצע = (A+B) /2

  6. הסתברות , סיכוי וסיכון , נקודת המוצא , והגורל :

    על פי הנתון :נאמר לנו שבכל מעטפה יש סכום כסף מסוים , והסכום שבאחת המעטפות (לא נאמר לנו באיזו) , כפול מהסכום שבמעטפה האחרת ;אחד הפירושים לנתון זה , שאומרים בודאות את הסכומים ; במידה ופירוש זה נכון , אזי במידה ומדובר בסכום גדול , כך שגם מחצית ממנו , תהווה תמורה נאותה , בהחלט לא משנה ; גם בסכומים קטנים , השיקול אם לבצע בחירה נוספת , הוא לא משמעותי ; ובמקרה ומדובר בקטע סכומים שבין המירביים , למזעריים ; יש ולפעמים המזל הטוב משחק לידיו של אדם , והוא זוכה .

  7. מדהים!! התחלתי לשגע עם החידה אנשים במשרד, ועכשיו כולם עם כאב ראש!! תודה!

  8. מיקו ההסתכלות שלך אינה “נכונה”.
    מהגדרת הבעיה יש אך ורק 2 אפשרויות.

    *
    הסכום הגבוה במעטפה א’, או הסכום הגבוה במעטפה ב’.

    *

  9. ניתן לראות את הפרדוקס בצורה הבאה.
    נניח כי ישנם שני משחקים:
    במשחק A שתי מעטפות של 50 ו-100
    במשחק B שתי מעטפות של 100 ו- 200.
    הבחירה בין שני המשחקים הינה אקראית לחלוטין (למשל על ידי הטלת מטבע) המשתתף אינו יודע את סוג המשחק שנבחר ועליו לבחור את אחת המעטפות.

    אם המשתתף יודע את הסכום במעטפה שבחר אז קיימת אסטרטגיית החלפה אופטימלית (להחליף אם יש 50 או 100 ולא לחליף במקרה של 200).

    המקרה המענין הוא כאשר המשתתף אינו יודע את הסכום במעטפה בה בחר. הדבר היחידי אשר המשתתף יודע הוא (כמו הדוגמה המקורית) שישנו סיכוי של 50% שיש במעטפה השנייה סכום כפול וסיכוי זהה למחצית הסכום. האם קיימת במקרה זה אסטרטגיית החלפה אופטימלית?
    ראשית ננתח מה הסיכוי שהמשתתף יבחר כל אחד מהסכומים.
    50 – ההסתברות לבחור במשחק A (שהיא 50%) כפול והסיכוי שיבחר במעטפה עם 50 (גם כן 50%) לכן 25%
    100 – 100 מופיע בשני המשחקים לכן הסיכוי הינו 50%
    200 – חישוב דומה למקרה של 50 כלומר 25%
    כעת ננתח את הרווחיות של אסטרטגיית ההחלפה בכל מקרה :
    50 – מקבל בודאות 100 לכן רווח של 50
    100 – סיכוי שווה שמהעטפה השנייה היא 200 (רווח של 100) או 50 (רווח של 50-) לכן הרווח הממוצע הינו 25
    200 – מפסידים בוודאות 100

    כעת נותר לנו לחשב את הרווח הממוצע שהוא המכפלה של הסיכויים ברווחים
    25%*50 + 50%*25 + 25%* -100 = 0

  10. בוודאי שאי ידיעת הסכום מגדילה את מספר האפשרויות.
    ברגע שאתה לא יודע מה הסכום ואיזה מהמעטפות היא הגדולה (בדיוק כמו שהוסבר בכתבה) יש לך בדיוק 3 סכומים
    X X/2 ו 2X
    אבל כפי שנאמר
    רק 2 אופציות יכולות להתממש

    הטריקיות כאן היא בנתונים
    מאחר ואתה לא יודע איזה מהמעטפות היא הגדולה
    ,אתה לא יודע מה הסכום ואתה בוחר במעטפה עם סכום X
    אז אתה לא יודע אם השניה מכילה X/2 או 2X
    ולכן יש פה 2 אפשרויות על המשתנה הנתון X שהוא הסכום במעטפה שבחרת
    האפשרות ה"מיותרת" רלוונטית רק לחישוב הסטטיסטי של "האם עדיף להחליף"

    אני אחדד את הדוגמא עם מספרים אמיתיים
    מונחות לפניך 2 מעטפות זהות בלה בלה בלה כמו שכתוב בכתבה

    בחרת מעטפה
    יש בה 100 שקל – אבל אתה לא יודע את זה
    בשניה יכול להיות או 50 שקל (X/2) או 200 שקל (2X)
    הרי אתה לא יודע מה הסכומים המעורבים ואתה לא יודע אם בחרת את המעטפה עם הסכום הגדול או לא
    ומכאן החישוב הסטטיסטי של הכתבה ממשיך

    בפעם השניה שאתה מבצע את הבחירה
    יכול להיות שאתה יודע שהסכומים הרלוונטים הם 100 ו 200 שקל ולא 100 ו 50 שקל
    אבל אתה ש-ו-ב לא יודע במה בחרת
    ב100? ב200?
    אם בחרת ב100 אז יש לך או X או 2X
    אם בחרת ב 200 אז יש לך או X או X/2
    לכן שלושת האופציות נכנסות למשוואה

    אל תשכחו שבסטטיסטיקה עסקינן
    מדובר על אפשרויות תיאורתיות – לא על מה שבפועל קורה

  11. מיקו, כאן הטעות שלך.
    זה שאתה לא יודע את הסכום, לא מגדיל את מספר האפשרויות שלו.

  12. כאן הטעות שלך
    אתה לא יודע מה הסכום לכן יכולים להיות כאן בדיוק 3 ערכים
    X X/2 ו 2X
    משמע
    בהנחה וX = 100 ובחרת את המעטפה הגדולה בין השתיים אז המעטפה השניה מכילה X/2 ולכן 50
    ובהנחה וX=100 ובחרת את המעטפה הקטנה בין השתיים אז המעטפה השניה מכילה 2X ולכן 200

    הטענה שלך נכונה במידה ואתה יודע את הסכום ואתה יודע איזה מבין המעטפות אתה בוחר

  13. כבר בהצגה של הפרדוקס, ומבלי להתעמק בו, רואים שהפרדוקס נובע מהצגה לא נכונה של הבעיה.
    בניתוח הראשוני של הפרדוקס מדובר על שלושה סכומים – 50, 100 ו- 200, בעוד בפועל יש רק שני סכומים.

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.