סיקור מקיף

משחקים רציניים נגד אויבים רצחניים

טרוריסטים, מבריחי סמים וגם נגיפים קטלניים הם אויבים מרים. שימוש נבון בתורת המשחקים עשוי לשפר את ההתמודדות עמם

מגדלי שמירה ניידים בשימוש חיל הים האמריקאי
מגדלי שמירה ניידים בשימוש חיל הים האמריקאי

ישראל בנימיני

בעבור טרוריסטים, נמל התעופה הבין-לאומי של לוס אנג’לס הוא ללא ספק יעד מושך להתקפה. נמל התעופה, הידוע בשם LAX, הוא השישי השוקק ביותר בעולם, ובשנת 2009 עברו דרכו כשישים מיליון (!) נוסעים. בעבור מי שמופקד על ביטחונו של המקום ועל הגנת חייהם של באֵי נמל התעופה, הצורך להציב את ההגנות הטובות ביותר הוא אתגר יומיומי: אי אפשר לשמור על כל נקודה בכל רגע, גם בגלל מגבלות תקציב וגם מכיוון ששמירה כזו תיצור עיכובים בלתי אפשריים ותמנע מנמל התעופה לתפקד. מצד שני, כל מַעבר שאינו שמור עשוי לשמש את הטרוריסטים לחדירה לתוך נמל התעופה ולהביא לאסון.

איך אפשר לבחור את תבניות השמירה ונקודות הבדיקה בצורה שתבטיח את הביטחון המרבי? בעבור מתמטיקאים, זהו סוג של משחק: המהלך הראשון הוא של מנהל האבטחה, הבוחר את תוכנית השמירה. המהלך השני הוא של הטרוריסט, המחליט על מסלול התקיפה שלו, או מחליט שלא לתקוף. שימוש בתורת המשחקים בעבור אפשרויות של חיים או מוות עשוי להישמע מוזר, אך יש לו היסטוריה ארוכה, הכוללת את השיקולים שהדריכו את פיתוח וייצור נשק גרעיני בתקופת המלחמה הקרה.

א.ס.א.פ. קריאייטיב | Carlos A Torres, Shutterstock

כאשר עדיף להחליט בצורה אקראית

ל”משחק LAX”, כפי שנתייחס אליו בהמשך, יש מאפיינים המייחדים אותו בהשוואה למשחקים אחרים המוכּרים למתמטיקאים. הוא משוחק מחדש מדי יום ביומו, כאשר בעבור ארגון הטרור, “הצלחה” אחת היא ניצחון אפילו אם היא באה לאחר הפסדים רבים. נוסף על כך, מנהל האבטחה חייב להניח כי תבנית ההגנה ידועה לתוקף, מכיוון שהוא יכול ללמוד את שיטות האבטחה במשך תקופה ארוכה. עובדה זו פוסלת תבניות קבועות: אם ההגנה תהיה תמיד באותן נקודות, יהיה קל לתוקף לבחור מסלול שאינו עובר דרך אותן נקודות.

לכן, כאשר אי אפשר לבדוק את כל דרכי התנועה של מכוניות לתוך LAXואת כל מסלולי ההליכה בתוכו, התבניות המועדפות הן אקראיות. כך יכול התוקף ללמוד את ההסתברויות לשמירה בנתיב מסוים, אך אינו יכול להיות בטוח אם ביום התקיפה נתיב זה אכן יהיה חשוף.

חשוב להבין כי משמעותה של בחירה אקראית אינה זריקת מטבע, והיא אינה משחררת את מנהל האבטחה מצורך בחשיבה ובתכנון. תבניות אקראיות קובעות הסתברות בעבור כל החלטה, כמו “הסתברות של 0.7 לסיור רכב משטרתי בקטע כביש א’; הסתברות 0.4 לבדיקה על-ידי כלבי גישוש באזור ב’ של הטרמינל, …”. חשוב לבחור תבניות טובות, אבל מהי תוכנית טובה וכיצד אפשר למצוא אותה?

מאז שנת 2007 מופעלת ב- LAXתוכנת ARMOR שפותחה כדי לענות על שאלות אלה. השם ARMOR, שמשמעותו באנגלית הוא “שִריון”, הוא ראשי תיבות של “עוזר לניטור אקראי של נתיבים” (Assistant for Randomized Monitoring Over Routes). את התוכנה פיתח צוות חוקרים מאוניברסיטת דרום קליפורניה עם פרופ’ שרית קראוס מאוניברסיטת בר-אילן.1

א.ס.א.פ. קריאייטיב | Yacobchuk Vasyl, Shutterstock

איך מודדים הצלחה?

כדי לבחור את התבנית, התוכנה זקוקה למידע על נקודות השמירה האפשריות ועל ה”רווח” הצפוי לתוקף אם יוכל לחדור דרך נקודות אלה. נדגים זאת במקרה פשוט: נניח שהתקציב מאפשר לשמור ברגע נתון רק על שתיים מתוך שלוש דרכי גישה, דרכים A, Bו-C. במקרה זה קיימות בעבור המגן שלוש אפשרויות שמירה בעבור המשחק המתרחש באותו רגע: Aו-B, Aו-Cאו Bו-C. אם לתוקף יש סיבות טובות להעדיף חדירה דרך Aאו B, ואפשרויות התקיפה שהוא יכול להגיע אליהן דרך נקודה Cמוגבלות יותר, מפתה להחליט לשמור רק על Aו-B.

זוהי החלטה גרועה, כמובן, מכיוון שהתוקף יוכל ללמוד כי נקודה Cלעולם אינה מוגנת ועשוי להעדיף את החדירה דרך נקודה זו: אף שה”רווח” ממנה נמוך יותר, סיכויי ההצלחה של פעולת הטרור גבוהים הרבה יותר במצב זה. החלטה טובה יותר היא תבנית אקראית בין שלוש האפשרויות: סיכוי של 70% לשמור על Aו-B, סיכויים של 15% לשמור על Aו-Cוסיכוי דומה בעבור Bו-C. לכן כל החלטה של התוקף כרוכה בסיכון של ממש בעבורו.

מכאן נובע שיש צורך במודל של התוקף, הכולל הערכה לרווח שהוא מייחס לכל מסלול תקיפה. הערכת הרווח עשויה להשתנות מיום ליום עקב קבלת מידע מודיעיני או אירועים בנמל התעופה, כמו ביקור של אישיות חשובה. כמו כן, קיימים כמה סוגי תוקפים שעשויים למצוא ב-LAXמטרה מושכת, כל אחד מסיבותיו שלו. לכן התוכנה זקוקה למודל בעבור כל סוג תוקף, ולהערכת ההסתברות לתקיפה בעבור כל סוג. ברור כי המידע הנמצא בידי המגן אינו שלם, ולכן אין ודאות כי הערכות ההסתברות והרווחים הכלולות במודל התוקף הן מדויקות. הכלים המתמטיים של תורת המשחקים מאפשרים להתמודד גם עם בעיה זו.

כאשר לא ידוע אם טרוריסטים התכוונו לתקוף מטרה מסוימת, קשה להעריך אם מערכת ההגנה הצליחה להרתיע אותם. עם זאת, אפשר למדוד הצלחה בדרכים אחרות, וביניהן ההצלחה בבלימת סוגים שונים של פשעים. לפי מדד זה, המתמטיקה של תורת המשחקים אכן מצליחה בעולם האמיתי: בשנת 2009, כאשר עיריית לוס אנג’לס העניקה אותות הוקרה למפתחי הפרויקט, ציין מפקד משטרת LAXכי התוכנה תרמה למעצרם של מחזיקי נשק בלתי חוקי ושל מבריחי סמים בנמל התעופה.

תוקף שאינו הגיוני

תורת המשחקים מניחה בדרך כלל כי כל שחקן פועל בדרך הטובה ביותר בעבורו, כלומר בדרך שתפיק בעבורו את התועלת הגבוהה ביותר. כפי שכלכלנים ופסיכולוגים כבר גילו, הנחה זו אינה מדויקת. ראשית, רוב האנשים מתקשים בחישוב מדויק של התועלת הצפויה מכל פעולה, גם כאשר מהלכי היריב וההסתברויות ידועות להם וגם כאשר הם מבינים היטב את תורת ההסתברות.

תופעה זו נקראת “רציונליות מוגבלת” (bounded rationality) והיא מובילה לבחירת מהלכים שאינם מיטביים, עקב מגבלה ביכולת החישוב (לא מדובר בטיפשות: בעבור בעיות רבות מסוג זה, גם מחשבי-על לא יצליחו למצוא את הפעולה המיטבית בזמן סביר). שנית, בני אדם מתקשים בהערכת הסתברויות, ובמיוחד הם נוטים לתופעת “עיגון” (anchoring), לאמור הם משמרים את הערכות ההסתברות הראשוניות שלהן גם כאשר מצטבר מידע הסותר את ההערכה ומצביע על הסתברות שונה.

לבסוף, גם התוקף הרציונלי ביותר עשוי להכיר רק מידע חלקי על תבניות הפעולה של המגן, גם כאשר המגן בונה תבניות אלה תחת ההנחה המחמירה שלפיה התוקף מכיר את התבניות ואת התוכנה היוצרת אותן. לכאורה, מגבלות הרציונליות והמידע של התוקף משפרות את סיכויי ההצלחה של המגן, אך מתברר כי כאשר המגן מתעלם ממגבלות אלה הוא עשוי לבחור באסטרטגיה לא נכונה. בדוגמה שהוצגה של שלוש דרכי גישה, יריב שיתעלם מהעובדה כי דרכים A ו-B מוגנות בהסתברות גבוהה יותר מאשר דרך Cיתקוף דרך אחת משתיהן, מכיוון שהן מגנות על מטרות עדיפות בעבורו. אילו היה יכול המגן להיות בטוח כי זוהי דרך החשיבה של התוקף, האסטרטגיה הנכונה הייתה הגנה רק על A ו-B, וההצלחה הייתה מובטחת.

במחקר נוסף במסגרת ARMOR נבדקו מורכבויות אלה דרך אלגוריתמים מתוחכמים יותר. כדי לבחון את הצלחת האלגוריתם במקרה זה, המתייחס למגבלות קוגניטיביות אנושיות, היה צורך בניסוי מול “תוקפים” אנושיים. לצורך כך גויסו משתתפים בניסוי שהתבסס על משחק מחשב. במשחק הם נדרשו לגנוב אוצר משודדי ים על-ידי בחירה של דלת שדרכה ייכנסו, בתקווה שבאותו רגע לא יהיה שודד השומר על דלת זו. למשתתפים ניתנה הזדמנות לצפות בשודדי הים ולראות על אילו דלתות הם שומרים במשך כמה “סיבובים” לפני שנדרשו לבחור את הדלת דרכה ינסו להיכנס בסיבוב הבא. כך איפשר הניסוי לבחון את השפעת זמינות המידע (ככל שמספר הסיבובים הנצפים גבוה יותר, הערכת ההסתברות יכולה להיות מדויקת יותר) על אסטרטגיית התוקף, ולבחון את הצלחת אסטרטגיות הגנה מול תוקפים שונים. בניסויים אלה נמצא כי האלגוריתמים שהתחשבו גם במגבלותיו של התוקף הגיעו להצלחה טובה יותר מול המשתתפים האנושיים.

א.ס.א.פ. קריאייטיב | Sebastian Kaulitzki, Shutterstock

משחק מוחות נגד נגיף

רופאים הבוחרים טיפול נגד נגיף ה-HIV, הגורם למחלת האיידס, משתתפים גם הם במשחק נגד יריב רצחני. כידוע, נגיף זה עובר מוטציות מהירות ולכן גם כאשר נמצא שילוב (“קוקטייל”) של תרופות המעכב את התקדמות המחלה, בסופו של דבר אחת המוטציות תוביל ליצירת נגיף שאף אחת מהתרופות בקוקטייל אינה יעילה נגדו. כאשר זה קורה, על הרופא המטפל למצוא שילוב אחר.

כדי למצוא שילוב יעיל, אפשר להשתמש בפיענוח הקוד הגנטי של הנגיף הנאסף מדמו של החולה. ארגונים בין-לאומיים אוספים מידע על המוטציות שנמצאו בנגיף, ועל ההגנה שכל מוטציה עשויה להעניק לנגיף מול תרופות שונות. מידע זה מופיע ב”טבלות מוטציות”. קיימות גם “מערכות מומחה” – מערכות בינה מלאכותית החוסכות את הצורך בעיון ידני בטבלאות בחיפוש אחר שילוב תרופות המתאים למוטציה החדשה. התוכנה מפיקה המלצות לשילוב תרופות, כאשר היא מתחשבת גם בכללים מורכבים ובאינטראקציות בין מוטציות שונות (למשל כאשר שתי מוטציות, בשני אתרים שונים בגנום הנגיפי, אינן מהוות בפני עצמן הגנה מפני תרופה, אך הופעת שתי המוטציות יחד גורמות לאותה תרופה להיות בלתי יעילה).

אחת הבעיות בשיטת טבלת המוטציות היא הצורך בהערכה אנושית שאותה מבצעים רופאים, שלכל אחד מהם גישה למידע רק על חלק קטן מכלל המטופלים. במאמר “לרדוף אחר נגיף האיידס”, שפורסם במרס 2010 על-ידי קבוצת חוקרים ממכון מקס פלאנק שבגרמניה מתוארות שיטות מתחום הביולוגיה החישובית ללמידה של הקשר בין הגנוטיפ (רצף הנוקלאוטידים המהווה את הקוד הגנטי של הנגיף) ובין הפנוטיפ (התנהגותו של הנגיף, המתבטאת בהקשר זה בעמידותו בפני תרופות).

הלמידה הממוחשבת מקצרת את תהליך הלמידה ומבססת אותו על סריקה מקיפה של מאגרי מידע גדולים. היא אף הצליחה לאתר במידע שנאסף מוטציות המובילות לעמידות בפני תרופות ושלא זוהו קודם לכן.

שביל הבריחה

שילוב תרופות מוצלח הוא כזה המצליח לעכב את זן הנגיף השוכן כרגע בגוף המטופל; אך אין די בדרישה זו: הנגיף יעבור מוטציות רבות. רוב המוטציות יורידו את יכולתו של הנגיף להזיק או את עמידותו לתרופות, אך יהיו גם מוטציות שיעניקו לו עמידות גבוהה יותר. כפי שמנבאים עקרונות הברירה הטבעית, המגיפים שבהם הופיעו מוטציות אלה יתרבו עד שיהוו את הזן העיקרי של הנגיף אצל אותו מטופל, ויידרש שילוב חדש של תרופות כדי להתמודד עם אותו זן חדש.

מסיבות שהבסיס הביולוגי שלהן אינו מובן דיו, לא כל סדרות המוטציות סבירות באותה מידה. אפשר לזהות “שבילי בריחה” – סדרות של מוטציות המופיעות בהסתברות משמעותית, ושבסופן הנגיף מפתח עמידות בפני הטיפול. החוקרים מתארים שיטות למידה הסתברותיות המאפשרות להם להקיש את מסלולי הבריחה מתוך המאגרים שבהם נאספים פיענוחי הקוד הגנטי של נגיפים כפי שהופיעו אצל עשרות אלפי מטופלים, עם המידע הקליני על הצלחת תרופות שונות במטופלים אלה. הלמידה הייתה קלה הרבה יותר לו היו זמינים נתונים אורכיים, כלומר הקוד הגנטי של נגיפים שנאספו בזמנים שונים אצל אותו מטופל, אך מידע כזה הוא נדיר. לכן נדרשו החוקרים לשיטות מתמטיות מתקדמות כדי להסיק את סדרות המוטציות ה”מועדפות” מתוך נתונים “רוחביים” – פרטי הקוד הגנטי של נגיפים שנאספו ממטופלים שונים.

לאחר שידועים אותם “שבילי בריחה”, וההסתברות בעבור ה”בחירה” של הנגיף בכל סדרת מוטציות כזו, אפשר לבחון את הטיפולים המוצעים לא רק לפי היעילות שלהם מול הזן הנוכחי של הנגיף אלא מול ה”מהלכים” הבאים של הנגיף. המילים “בחירה” ו”מהלכים” מופיעות במרכאות מכיוון שהנגיף כמובן אינו חושב או מתכנן, אך המוטציות האקראיות עם סינונן בתהליך הברירה הטבעית ממלאים תפקיד דומה. גם ב”משחק” זה, כמו ב”משחק LAX”, הרופא בוחר את הצעד הראשון בצורה שתקטין ככל האפשר את ההצלחה הצפויה לכל צעד שיבחר בו התוקף.

בעזרת מידע זה אפשר לבדוק שילובי תרופות מוצעים ולהעריך עד כמה כל אחד מהם יעיל נגד הזן הנוכחי ונגד הזנים שסביר כי זן זה יגיע אליהם דרך המוטציות השכיחות. מחברי המאמר מדווחים כי השימוש ב”אופטימיזציית טיפול” בשיטה זו עשוי להוריד את מספר הטיפולים הלא-יעילים מ-24% אל פחות מ-15%, וכי כיום המרפאות המטפלות בשני שלישים מתוך חולי האיידס בגרמניה נעזרות בתוכנה שפותחה במסגרת פרויקט זה.

גם מחקרים אחרים נעזרים בתורת המשחקים כדי להתאים משטרי טיפול לחולי איידס. אחד החדשים מביניהם הוא מאמר שפרסמו חוקרים מאוניברסיטת טנסי לפני כמה חודשים, שבו מיוצג מהלך המחלה כמשחק בין הנגיף ובין “קואליציה” המורכבת ממערכת החיסון ומהטיפול התרופתי. מחקר זה הראה כי קיים מצב שיווי משקל (כלומר מצב שבו לאף אחד מהצדדים אין יתרון בשינוי האסטרטגיה שלו) שבו תאי ה-Tשל מערכת החיסון ממשיכים לשרוד.

משחקים ברצינות

תרומתה העיקרית של תורת המשחקים, למרות שמה, היא בתחומים שאינם נתפשים כמשחק וביניהם כלכלה, מלחמה, משא ומתן, שימוש יעיל בתדרים (וראו: “משחק ההפרעות: איך לבחור תדרי תקשורת”, “גליליאו” 139) ועוד. גם כאשר ה”שחקן” היריב אינו שותף להעדפות או לערכים המנחים את השחקן המגן, אינו בהכרח רציונלי גם לפי אמות המידה שלו-עצמו, ואינו מעוניין לקבל עליו חוקי משחק כלשהם, עדיין קיימים כלים בתורת המשחקים, בבינה המלאכותית ובמתמטיקה המאפשרים לבחור את המהלכים הטובים ביותר כדי להגן עלינו מפני שחקנים רצחניים כאלה. כלים אלה כבר הוכיחו את יעילותם במבחנים מעשיים, והם מסתעפים לשימושים נוספים: לדוגמה, הקבוצה שפיתחה את ARMOR פיתחה גם תוכנה לשיבוץ סוכנים בבגדים אזרחיים המגִנים על טיסות בין-לאומיות מפני חטיפה, ותוכנה זו נמצאת בניסוי מעשי מאז אוקטובר 2009.

1. פרופ’ שרית קראוס היא כלת פרס א.מ.ת – אמנות, מדע, תרבות – בתחום המדעים המדויקים לשנת 2010, עם פרופ’ דוד הראל ממכון ויצמן למדע.

ישראל בנימיני עובד בחברת ClickSoftware בפיתוח שיטות אופטימיזציה מתקדמות.

תגובה אחת

  1. אוי לי אם הבטחון של כל בן אדם יהיה תלוי בחישובי משחקים ומהלכים של ממשלות וטרוריסטים….
    הטרוריסטים ינצחו גם בלי כל הטריקים של התקשורת והסטת התמיכה פוליטית מהממשלה.

    קראתי פעם שמפושעיםבאמת קוראים למקצוע שלהם “המשחק” … הממשלות צריכות לדאוג לחופש הפרט ו”חוזה חברתי” (societal contract) הוגן כדי לצמצם את התופעות האלה וכדי לא להיות לבד מול הצד השני של החוק.
    אתמול בשידור החדשות הזה IBA של ערוץ אחד דיברו שהמהומות בערב הואצו ע”י פרסום ידע חדש בתחום של “מהפכה לא אלימה המונית” מה שעזר בארגון…

    גם מעצמות הן לא כל יכולות.

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.