סקרי בחירות, בעיות בסטטיסטיקה והצעה לפתרונן

הסטטיסטיקן הראשי ונשיא האגודה הישראלית לסטטיסטיקה דנים בתפקידם של סקרי בחירות בחברה שלנו, הסיבות האמתיות לפערים בין תחזיות הסקרים ותוצאות האמת, וגם להעלות הצעה לפתרון הבעיות שגרמו לשגיאות בתחזיות ששודרו בטלוויזיה.

תוצאות מדגם. איור: shutterstock
תוצאות מדגם1. איור: shutterstock

פרופ' דני פפרמן ופרופ' דוד שטיינברג

אין ספק שיום הבחירות לא ייזכר כשעתו הגדולה של מדע הסטטיסטיקה. קמפיין הבחירות של החודשים האחרונים התאפיין בסקרים רבים שהתפרסמו בעיתונים והוצגו בכלי התקשורת. בליל הבחירות, הציגו הסוקרים לאומה את התחזיות שלהם, שהתבססו על מדגם קטן מכלל הקלפיות. השנה היו פערים לא קטנים בין תוצאות הבחירות לבין תוצאות הסקרים האחרונים שפורסמו, וגם ובעיקר, בין התחזיות ממדגם הקלפיות בשעה 22:00 בלילה ותוצאות האמת.

הגיעו הדברים לידי כך שבסקרים שעורכת הלשכה המרכזית לסטטיסטיקה (למ"ס) הידועים במהימנותם, ניכרת בשבוע האחרון ירידה בשיעור המשיבים כאשר חלק מהנדגמים לא הססו ללגלג על יכולת הסקרים לספק אומדנים מדויקים של התופעות הנחקרות. ברצוננו לדון כאן בתפקיד של סקרי בחירות בחברה שלנו, הסיבות האמתיות לפערים בין תחזיות הסקרים ותוצאות האמת, וגם להעלות הצעה לפתרון הבעיות שגרמו לשגיאות בתחזיות ששודרו בטלוויזיה.

ראשית דבר, חשוב להבין מה המטרה של סקר. סקרים מתבצעים כדי לקבל תמונת מצב של החברה בנקודת זמן נתונה. תמונה זו יכולה לשקף דעות פוליטיות (כדוגמה הסקרים לקראת הבחירות), נושאים חברתיים וכלכליים, נושאים של איכות סביבה וכדומה. חברה מסחרית המתלבטת אם כדאי להשיק מוצר חדש יכולה לאסוף מידע חשוב על ידי ביצוע סקר שיבדוק עד כמה המוצר אטרקטיבי לצרכנים. עיריות מבצעות סקרים לקביעת סדר עדיפויות בין פרויקטים שונים, המתחשב ברצון התושבים. סקרים ממלאים תפקיד חשוב ביותר למנהל ולמדיניות ממשלתית. הלמ"ס מבצעת סקרים רבים ומגוונים לפי חוק, על מנת לאפשר את ניהול המדינה תוך התבססות על מידע מוצק. אחד מאותם מוסדות מדינה המשתמש באופן קבוע בתוצאות סקרי הלמ"ס לקביעת מדיניות הוא בנק ישראל, שגם מבצע סקרים משל עצמו.

האם סקרים מסוגלים לתת צילום מצב מהימן?

אנו משוכנעים שהתשובה חיובית, כל עוד הסקרים מתבצעים ומנותחים כראוי. מדע הסטטיסטיקה מפותח דיו על מנת לדגום ולחשב אומדנים מדויקים תוך התמודדות עם בעיות כמו חוסר השבה, טעויות השבה, מדגמים קטנים ועוד. חשוב גם להדגיש שיחד עם חישוב האומדנים, מחושבים גם מדדים למידת דיוקם. יחד עם זאת, חשוב להצביע על מספר היבטים הנחוצים, לדעתנו, על מנת לקרוא בחכמה את תוצאות הסקרים ולהבין את מוגבלויותיהם. בביצוע הסקרים יש צורך להקפיד על כללים סטטיסטים ידועים לבחירה מקרית של המשתתפים בסקר. כללים אלו דואגים שהמדגם לא יהיה "מוטה", עם ייצוג לא שווה של קבוצות שונות באוכלוסייה. אם נוצרת הטיה עקב חוסר השבה, יש שיטות סטטיסטיות ידועות לתיקון האומדנים תוך שימוש במידע נוסף. למשל, אם משתתפי הסקר כללו פחות גברים מאשר חלקם באוכלוסייה, ניתן "לנפח" את המשקל של הגברים שנסקרו. בנוסף, בחירה מקרית של המשתתפים מאפשרת לכמת את גודל הטעות האפשרית של הסקר.

איך אפשר להסביר את הפערים בין הסקרים שלפני יום הבחירות לבין תוצאות הבחירות?

• כאמור, סקרים מצלמים מצב ביום נתון. סקר שהתבצע שבוע לפני הבחירות אינו מתיימר "לנבא" את תוצאות הבחירות, אלא לשקף את הלך הרוח בציבור אילו נערכו הבחירות ביום שבו בוצע הסקר.
• יתרה מכך, כפי שנידון בהרחבה רבה בספרות המדעית, תוצאות הסקרים משפיעות לא אחת על תוצאות הבחירות, כאשר בוחרים מחליטים למי להצביע בהתאם לתוצאות הסקרים. למעשה, בעידן המודרני לא תמיד ברור האם הסקרים מנבאים את תוצאות הבחירות, או שתוצאות הבחירות מושפעות מתחזיות הסקרים. כך למשל, בבחירות 2015, חלק ניכר של תוספת ההצבעה לליכוד בא על חשבון הבית היהודי, ככל הנראה בתגובה לסקרים האחרונים בהם התגלה יתרון למחנה הציוני על פני הליכוד. הסקרים שלפני הבחירות לא הצליחו לבטא שינויים אלו במידה מספקת, בעיקר בגלל שהשינויים התרחשו בתקופה מאוד קצרה בין הסקרים האחרונים לבין הבחירות.
• חשוב גם לזכור שלכל סקר יש מידה לא מעטה של אי-ודאות. רוב סקרי הבחירות בנויים ממדגם של כ-500 משיבים. מדגם בגודל כזה מספיק על מנת לתת תמונה מספיק אמינה של המנדטים הצפויים לכל מפלגה, אך עם טעות של כ-3-2 מנדטים.
אנו חוזרים ומתריעים – סקר בחירות אמור לשקף את המצב ביום הסקר, ולא ביום הבחירות. אין לצפות מסקרים הנערכים לפני יום הבחירות לנבא נכון את תוצאות הבחירות, בפרט אם חלים שינויים בדפוסי ההצבעה ביום הבחירות עצמו, כפי שהתרחשו בבחירות האחרונות.

ומה לגבי התחזיות של ליל הבחירות?
לכאורה, כל המגבלות שצוינו לעיל לגבי סקרים הנערכים לפני הבחירות אמורות להיעלם, חוץ אולי מגודל המדגם, שכן סקרי הטלוויזיה נערכים ביום הבחירות עצמו. ואמנם, התחזיות היו מדויקות דיין בחיזוי התוצאות של המפלגות הקטנות, אך כשלו בחיזוי חלוקת המנדטים בין שתי המפלגות הגדולות, כאשר גודל וכיוון הטעויות לגבי שתי מפלגות אלו נשא השלכות פוליטיות משמעותיות ביותר. יחד עם זאת, חשוב לזכור שהתחזיות ממדגמי הטלוויזיה נשענות על מספר מרכיבים חיוניים: בחירה נבונה של קלפיות המדגם, מודל סטטיסטי חכם המסוגל להשתמש בתוצאות המדגם לתחזית כלל ארצית, יכולת לאבחן מגמות לאורך שעות היום (וזאת כדי לפצות על כך שההצבעה ממשיכה עד השעה 22:00 אך המדגם חייב להיסגר בסביבות השעה 20:00 ובכך לאפשר את חישוב התחזית עד השעה 22:00), ואולי חשוב מכל, שיתוף פעולה של הציבור הנסקר במדגם הקלפיות. שיתוף הפעולה מתבטא בשני היבטים. הסכמה להשתתף במדגם הטלוויזיה, והצבעה זהה במדגם הטלוויזיה ובהצבעת האמת.

מהן החוליות החלשות בשרשרת זו?
ניתוחים של הסוקרים לאחר יום הבחירות הראו שהמדגמים והמודלים בהם השתמשו נתנו תחזיות מאוד מדויקות כאשר הם התבססו על תוצאות האמת מקלפיות המדגם ולא על ההצבעה הנפרדת בקלפיות הטלוויזיה.
ניתן להסיק לכן כי הטעות באומדן מספר המנדטים של שתי המפלגות הגדולות נבעה משתי הבעיות האחרונות:
• שינויים באופן ההצבעה בשתי השעות האחרונות
• חוסר שיתוף פעולה מספק מצד הנדגמים. הסוקרים דיווחו על היקפי סירוב גבוהים בבחירות האחרונות בהשוואה לשנים קודמות. חוסר שיתוף פעולה יכול להטות את המדגם ואת תוצאות התחזית. בניגוד לסקרים הרגילים, בהם נאסף מידע צולב מהנסקרים וממקורות מנהליים כדי לבחון ולתקן הטיות כאלו, אין מידע זמין ביום הבחירות המאפשר לבצע תיקונים כאלו.

כיצד ניתן להתמודד עם בעיות אלו?
לצערנו, אין סיבה לחשוב שמידת שיתוף הפעולה עם מדגמי הטלוויזיה תשתפר. גם דפוס הצבעה שונה בשעות האחרונות להצבעה יכול לחזור על עצמו, כאשר מצד שני, קשה להסיק מבחירות בשנה מסוימת לבחירות בשנה אחרת. חשוב לציין בהקשר זה שאין מידע מספיק לגבי פרופיל המצביעים בשעות השונות, אם כי מידע כזה ניתן לאסוף ולנתח. כמו כן, איסוף מידע צולב אינו אפשרי בלחץ של יום בחירות. לכן, המשך קיום מדגמי הקלפיות במתכונת הנוכחית עלול לגרום לתרחיש חוזר של שוני משמעותי בין התחזיות לבין תוצאות האמת.

לדעתנו, יש דרך ברורה ואפילו פשוטה כדי להגיע לתחזיות מדויקות ביום הבחירות – לבסס אותן על תוצאות האמת במדגם הקלפיות, ולא על הצבעה נפרדת מאותן קלפיות שעורכים אמצעי התקשורת. בדרך זו יהיה "שיתוף פעולה" מלא של המשתתפים בסקר, והוא ישקף את ההצבעה בכל שעות היום, כולל בשעתיים האחרונות. על מנת להתבסס על תוצאות אמת, יהיה צורך לספור במהירות את הקולות בקלפיות שנבחרו כקלפיות מדגם, ולשם כך יהיה צורך בתגבור צוותי הספירה הרשמיים באותן קלפיות מועטות (כ-60 קלפיות במתכונת העכשווית), על מנת לזרז את הספירה. לחלופין, ניתן לדגום מתוך קלפיות האמת, למשל, לספור כל פתק רביעי, אך ייתכן שהדגימה רק תסרבל את תהליך הספירה. תגבור משמעותי של צוותי הספירה כרוך בעלות זניחה בהשוואה לעלות המדגמים הנוכחיים. המחיר שייגבה מהציבור הוא שנהיה חייבים לחכות שעה נוספת לקבלת התחזיות. לדעתנו, שעה של איחור היא מחיר ראוי לתחזית אמינה. אנו פונים לאמצעי התקשורת לאמץ את הצעתנו, לדאוג לספירה מהירה בקלפיות המדגם תוך תגבור צוות הסופרים, ולחדול מלפרסם תחזיות המתבססות על תוצאות מדגמיות של הנדגמים בסקרי הטלוויזיה.

הערות הלשכה המרכזית לסטטיסטיקה
במאמר זה ניתנה חוות דעת מקצועית של אנשי מקצוע. ללמ"ס אין קשר לסקרי הבחירות ולניתוח תוצאות המדגם.
פרופ' דני פפרמן הסטטיסטיקן הממשלתי, הלשכה המרכזית לסטטיסטיקה והאוניברסיטה העברית, ופרופ' דוד שטיינברג נשיא האיגוד הישראלי לסטטיסטיקה ואוניברסיטת תל אביב

שיתוף ב print
שיתוף ב email
שיתוף ב whatsapp
שיתוף ב linkedin
שיתוף ב twitter
שיתוף ב facebook

18 תגובות

  1. יוסי, אני מסכים איתך שזה לא סביר שלכולם היו את אותה שגיאה.
    אך יש עוד הסברים מלבד זיוף.
    אני גם לא רואה אינטרס גדול בזיוף כאשר תוצאות האמת הן רק יום לאחר מכן. לדעתי יש כאן העתקה של הערוצים ממקור אחד. ומכאן כולם עושים את אותה טעות. מוזר אגב שאף אחד לא דיבר על כך

  2. תוצאות הסקרים ללא ספק מזויפות
    ע"פ חוקי הסטטיסטיקה חייב להיות כאן זיוף מכוון
    לא יתכן שכולם עשו את אותה טעות
    משל למה הדבר דומה: 10 אנשים שהתבקשו לנחש מספר בין 1 ל 10 וכולם ניחשו את אותו המספר, ברור שמדובר בזיוף
    אם הניחושים היו מתפלגים בין הספרות 1 ל 10 אזי ניחא , ניתן לומר שהם לא יודעים לעשות את מלאכתם אך אין כאן תיאום מראש
    כאן מדובר בבירור בזיוף ותיאום
    שאלה , האם אין בחוק עונש או סנקציה נגד תופעה זו ?

  3. יוסי, מדגמים דווקא היו בפריפריה, לא מעט.
    ושוב, גם טיעונך ורשמך המהוללים אינם עונים על השאלה ששאלתי כמה תגובות מטה

  4. הסטטיסטיקה כשלה בניגוד לעקרונות יסוד של הסטטיסטיקה כמדע.
    שילכו לעשות שיעורי בית ויבצעו יותר סקר בפריפריה ופחות בגוש דן . שילמדו את המיתאם בן משתתפי הסקר למידת השכלתם -ולפיכך לנטייתם הפוליטית.
    אפשרות אחרת: שיעור המדגם של סקר כ 800 איש על כ 5 מליון 0.00016 הוא קטן מדי לאוכלוסיה סקטוריאלית ואינו נותן רמת סמך גבוהה. מדגם סביר צריך להיות בתוך סטיית התקן והיא כנראה הרבה יותר גדולה.

    לכן הניבוי שניתן הוא סביר למה שבוצע.

    ניסו לייצר אווירת ניצחון והיו מבושמים בעצמם בשעה שהיה ברור שהם מפריזים בערכם.

    לא לחינם נאמר אל יתהלל חוגר כמפתח.

  5. איזה ביאוס שניגררים כאן לויכוח פוליטי מטופש שבסופו של דבר מסתיר את השאלה הכנה שלי במלא זבל ותאוריות קונספירציה של ילדים קטנים… 🙁

  6. לך תבנה מדינה לימנים.כי אתה לא סופר שמאלנים(כאמור אתה לא יודע עיברית). לכאורה טוקבק זה מדיום נחות,אבל זו הזדמנות להבין איך מסומם חושב.

  7. אר יאיר
    ככל הנראה אתה צודק. זאת המסקנה שרבים הגיעו אליה, כולל אותי.

    MH
    לא, חמוד.
    הם לא "מעתיקים אחד מהשני…"
    הם פשוט אנשים בעלי אג'נדה סמולנית. שרוצים לקדם את האג'נדה (סדר-יום) שלהם בתוך העולם הפוליטי, באמצעות ועל חשבון הצופים, המאזינים והקוראים (האזרחים) התמימים.

    0

    "אתה אפילו לא דובר עברית" – 🙂 חמוד..

    אז הנה עוד כמה מילים ""לא"" בעברית:

    "בוא נגיד שמי שויתר על חברון זה נתניהו. ומי שנתן יד לשיחרור מחבלים והקפאת בניה זה בנט." – כן כן בסדר…
    אתה אומר את השטויות האלו רק מהסיבה היחידה שהשמאל לא נמצא בשלטון (ולכן לא הצליח לפרק את המדינה לקנטונים) ואתה מרגיש בטוח לזרוק רפש על ראש הממשלה שלך.

    אתה צריך להתבייש בעצמך.

    "ביבי משתין עליך ועל כל עם ישראל בקשת" –
    מוזר מה שאתה אומר..
    הרוב, והשפויים במדינה הזאת שבחרו ימין, די בטוחים שהוא משתין דווקא עליכם… 😉

  8. "שמאלנים בחוצה" אתה אפילו לא דובר עברית.אז תפסיק אם הביריונות. בוא נגיד שמי שויתר על חברון זה נתניהו. ומי שנתן יד לשיחרור מחבלים והקפאת בניה זה בנט.ביבי משתין עליך ועל כל עם ישראל בקשת( כי ביבי גרם לחילול שבת המוני,לפני נאום הבחירות בקונגרס.עלק ביקור בכותל).

  9. אר יאיר רוב המצביעים לביבי היו אשכנזים. כל ה"לבנבנים" הזה הוא לא לעינין.

  10. אר יאיר, זה לא נשמע הגיוני שבכל מני מקומות שונים. אלפי אנשים שיקרו במדגמים, במקומות שונים. בעיקר שלא היה על זה דיבור/בקשה ברשתות החרתיות (פייסבוק/וואטסאפ)… זה משהו שלא מתקבל על הדעת…

    זהו התירוץ של הסוקרים. אך הוא לא משביע את ההגיון

  11. מה שקרה לדעתי זה שהרבה ימניים (מזרחיים, דתיים, חרדים, פריפריאליים, מתנחלים וכו') זייפו במדגמים של הערוצים, ואלה שלא רצו לשקר פשוט התנגדו להשתתף.
    מה הסיבה? מחאה נגד התקשורת ה'סמולנית', הבועתית, הצפון תלביבית, הלבנבנה, שבעה, בורגנית……להמשיך?

  12. שאלה (ותשובה איפשרית): איך זה הגיוני שבכל שלושת הערוצים המדגמים היו מאוד דומים למרות שהקלפיות שלהם היו ממוקמים במקומות אחרים ותוצאות האמת היו שונות??

    הייתי מצפה שלפחות באחד הערוצים יהיו תוצאות שדומות יותר לתוצאות האמת/ תהיה טעונת שונה.

    המסקנה שלי היא שהערוצים מעתיקים אחד מהשני…
    וכמובן לא כמו שונא השמאלנים שמתחתי (ילד קטן), אני בטוח שהערוצים מעדיפים כסף (שברור שתוצאות שיותר קרובות לאמת=יותר כסף) מאשר לזייף תוצאות מדגם לפי חפץ נפשם

  13. כל הכתבה הזאת היא בדיחה של 1 באפריל. בדיחה טובה.

    "בעיות בסטטיסטיקה" עלאק…….

    אין בעיות בסטטיסטיקה.

    יש בעיות אם אלו שביצעו את הסטטיסטיקה.. הבעיה שלהם היא שהם שמאלנים. ולכן גם "קלעו" עקום. בדיוק כמו בבחירות הקודמות (ואלו שלפניהם וגם אלו שלפני…).
    במקום לעשות סטטיסטיקה הם פרסמו את משאלות הלב שלהם.. ("פוליטיקה" אמרנו?)

    וכמובן – המפסידנים השמאלנים לא יודעים להפסיד (מה חדש?) וישר מתחילים להאשים את כל העולם בבעיות שלהם.

    "9" (היית צריך לרשום "0" יותר מתאים לך)

    "אבל בניגוד למה שחושבים הליכוד לא הייה בשלטון לנצח." – הליכוד לא. אבל האג'נדה הימנית תמשיך לתת לך בראש. תהיה בטוח בזה. לא מתאים לך לך לעזה.

  14. גם אם זויפו 2 מנדטים תמונת הגושים נותרה דומה. לצערי המפלגה שאני הצבעתי לה לא זכתה לרוב,אך כוחה עדיין חזק. מי שהקשיב לאימן עודה האמין לאמירותיו הגזעניות של ביבי. אבל בניגוד למה שחושבים הליכוד לא הייה בשלטון לנצח.

  15. הבחירות האלו זויפו. בסוף היום הגיעו לבחור המוני מתים, כאלו שנמצאים בחו"ל וזקנים שקשה להם לצאת מהבית. הכל עם תעודות זהות מזויפות. אבל אלו נמנעו מהקלפיות המדגמיות.
    אז איך אני יודע? אני מכיר מישהוא שגר בחו"ל כבר כ-40 שנה. יום בחירות אחד לפני כמה שנים הוא היה במקרה בביקור בארץ. הוא ניגש לקלפי ורצה להצביע. אמרו לו: אדוני, אבל כבר הצבעת. הוא אמר שלא. אז קראו לשוטר שהוציא אותו כמעט בכוח. אמרתי לו שאם הוא יבקר בארץ שוב ביום בחירות, אז שילך להצביע מייד עם פתיחת הקלפיות.
    ולמה אתם חושבים אין עד היום תעודות זהות או דרכונים עם קריאה דיגיטלית? כי אז קשה יותר לזייף את התעודה. ממשרדי הפנים לדורותיהם נעלמו מאות אלפי תעודות זהות. גם התעודות החדשות שיש למיעוט מהאוכלוסיה אינן מקושרות לשום קורא בקלפיות.

כתיבת תגובה

האימייל לא יוצג באתר.

דילוג לתוכן