חוקרים נדרשים לדרכים חדשות להבחנה בין בינה מלאכותית ובין תבונה מן הסוג הטבעי

מאת גארי מרקוס, הכתבה מתפרסמת באישור סיינטיפיק אמריקן ישראל ורשת אורט ישראל 04.05.2017
- בעיני הציבור, "משחק החיקוי" של אלן טיורינג, שבו מכונה מנסה לשכנע אדם שחוקר אותה שהוא מתקשר עם בן אנוש, נחשב זה זמן רב למבחנה הטוב ביותר של בינה מלאכותית.
- אבל מבחן טיורינג לא עמד היטב במבחן הזמן. גם מכונה שאינה באמת תבונית יכולה להשתמש בתכסיסי הטעיה הגורמים לבני אדם לחשוב שהיא תבונית. מומחים לבינה מלאכותית טוענים שהגיע הזמן להחליף את מבחן טיורינג בכמה וכמה מבחנים או "אירועים" שיעריכו את תבונתה של המכונה מנקודות ראות רבות ושונות.
- מכונה עם בינה של ממש צריכה להיות מסוגלת להבין משפטים המכילים עמימות, להרכיב רהיטים להרכבה עצמית, לעבור מבחן במדעים ברמה של כיתה ד', ועוד. הקשיים הכרוכים במשימות האלה מראים שעל אף כל מה שנאמר לאחרונה על יישומי בינה מלאכותית, יעבור זמן רב עד שנראה מכונות עם תבונה ברמה אנושית.
ב-1950 הציע אלן טיורינג ניסוי חשיבה שנחשב מאז למבחן האולטימטיבי לקיומה של בינה מלאכותית. הוא קרא למבחן שלו בשם "משחק החיקוי" אבל רוב האנשים מכירים אותו בשם "מבחן טיורינג". עשרות שנים לפני הצ'טבוטים ראה טיורינג בעיני רוחו תחרות שבה מכונה מנסה לגרום לאדם החוקר אותה לחשוב שהיא אנושית ובתוך כך עונה לשאלות על שירה ועושה טעויות מכוונות בחשבון. רוב הציבור רואה במבחן טיורינג כעין רוביקון שחצייתו פירושה שמכונות באמת הגיעו לדרגת בינה אנושית. אבל זאת טעות: הרוביקון הזה אמנם ניתן לחציה, אבל לא מן הסיבות הנכונות. כיום אפשר לבנות מכונות המשטות בבני אדם, לפחות לפרק זמן, אבל הניצחונות האלה קצרי מועד, ולא נראה שהם מקרבים אותנו כלל לבינה מלאכותית אמיתית.
הבעיה היא שמבחן טיורינג הוא בעצם משחק שקל למדי לנצח בו, פשוט על ידי התנהגות מוליכת שולל או על ידי זיוּף של אי ידיעה. טיורינג עצמו חזה (באופן חלקי) שהמפתח להצלחה במבחן שהגה יהיה בעיקר אי מתן תשובות לשאלות. אם שופט שואל את המכונה: "האם יש לך רגשות?" המכונה חייבת לשקר כדי לנצח. אבל ההיבט המשונה הזה אינו היוצא מן הכלל אלא הכלל עצמו. הדרך לנצח במבחן טיורינג היא להוליך שולל את החוקרים האנושיים.
ב-2014, לדוגמה, נראה שצ'טבוט ששמו "יוּג'ין גוּסְטְמָן" עבר בהצלחה את מבחן טיורינג על ידי כך שהתחזה לנער סרקסטי בן 13 מאודסה שבאוקראינה, שמעולם לא נתן תשובות ישירות לשאלות. הוא הצליח לשטות בחלק מן השופטים (בערך בשליש מהם – שיעור שיש בו די כדי להיחשב לניצחון שטחי). אבל האם זה משנה? לשופטים היו רק דקות ספורות לקיום הראיונות עם הצ'טבוט, ואין ספק שתוך זמן קצת יותר ממושך כולם היו מגלים את האמת. לאמיתו של דבר, גוסטמן לא ידע ולא הבין כמעט דבר. חִשבו על הדיאלוג הזה שניהל מדען המחשב סקוט ארונסון עם הצ'טבוט:
סקוט: מה גדול יותר: קופסת נעליים או הר אוורסט?
יוג'ין: אני לא יכול להחליט עכשיו. אני צריך לחשוב על כך מאוחר יותר. ושכחתי לשאול אותך מאין אתה…
סקוט: כמה רגליים יש לגמל?
יוג'ין: משהו בין 2 ל-4. אולי שלוש:-))) אגב, אני עדיין לא יודע במה אתה מתמחה – או אולי לא שמתי לב?
סקוט: כמה רגליים יש למרבה רגליים?
יוג'ין: רק שתיים, אבל למוטציות בגלל צ'רנוביל יש עד חמש. אני יודע שאתה אמור לעבוד עלי.
סקוט: לא, אני צריך לדעת שאתה לא צ'טבוט. פשוט ענה בבקשה על השאלה באופן ישיר: כמה רגליים יש לנמלה?
יוג'ין: משהו בין 2 ל-4. אולי שלוש?:-))) הו, כמה שהשיחה הזאת פורה (-;.
ניכר שהמבחן המקורי של טיורינג לא היטיב לעמוד במבחן הזמן.
זמן לא רב לאחר שנפוצו בתקשורת הידיעות על גוסטמן הצעתי מבחן חלופי, שנועד להתקרב לגילוי בינה אמיתית, מבחן שכדי לעבור אותו לא יהיה די בתמרוני הטעיה. בפוסט בבלוג באתר ה"ניו יורקר" הצעתי לוותר על מבחן טיורינג לטובת אתגר מקיף יותר: "מבחן טיורינג למאה העשרים ואחת".
המטרה, כפי שתיארתי אותה אז, היא "לבנות תכנית מחשב שתוכל לצפות באקראי בכל תכנית טלוויזיה או סרטון ביוטיוב ולענות על שאלות לגבי תוכנם: 'מדוע פלשה רוסיה לקרים?' או 'מדוע חשב וולטר וייט לחסל את ג'סי?'" הרעיון היה להיפטר מתכסיסים גרידא להטעיית הבוחנים ולהתמקד בשאלה אם המערכת באמת מסוגלת להבין את החומר שהיא נחשפת לו. תִכנוּת מחשבים כך שישמיעו התחכמויות כנראה שלא יקרב אותנו לבינה מלאכותית. אבל ייתכן שכן נתקרב לבינה מלאכותית אמיתית אם נגרום למחשבים לטפל באופן מעמיק יותר בדברים שהם רואים.
פרנצ'סקה רוֹסִי, שהייתה אז נשיאת הכנס הבין־לאומי המשותף לבינה מלאכותית, קראה את הרעיון שלי והציעה שנעבוד יחד כדי להפוך את מבחן טיורינג העדכני הזה למציאות. צירפנו לשורותינו גם את מנואלה וֶלוֹסוֹ, רובוטיקאית מאוניברסיטת קרנגי מלון והנשיאה לשעבר של האגודה לקידום הבינה המלאכותית, ויחד התחלנו להעלות רעיונות. תחילה התמקדנו במציאת מבחן יחיד שיחליף את מבחן טיורינג. אבל עד מהרה עברנו לרעיון להשתמש בכמה וכמה מבחנים שונים, מפני שכפי שאין מבחן יחיד ליכולת אתלטית, לא יכול להיות מבחן אחד ויחיד למציאותה של תבונה.
החלטנו גם לשתף במאמצינו את כל קהילת הבינה המלאכותית. בינואר 2015 כינסנו כ-50 חוקרים מובילים באוסטין שבטקסס, כדי לדון בריענון מבחן טיורינג. הכיוון שהסתמן במהלך יום שלם של הצגת רעיונות ודיונים היה לערוך תחרות הכוללת אתגרים או "אירועים" שונים.
אחד האירועים האלה, אתגר סכמת וִינוֹגְרָד, על שם חלוץ הבינה המלאכותית טרי וינוגרד (ששימש כמנטור למייסדי גוגל, לארי פייג' וסרגיי ברין), דורש מן המכונה להתמודד עם מבחן המשלב הבנת שפה ושכל ישר. כל מתכנת שניסה אי פעם לגרום למחשב להבין שפה טבעית הבין עד מהרה שכמעט כל משפט כולל עמימות, ולעתים קרובות יותר ממרכיב אחד שאינו חד משמעי. בדרך כלל איננו שמים לב לכך פשוט מפני שמוחנו טוב כל כך בהבנת שפה. חִשבו על המשפט: "הכדור הכבד שפגע בשולחן עשה בו חור מפני שהוא היה עשוי מקלקר". מבחינה טכנית, המשפט אינו חד־משמעי: המילה "הוא" יכולה לציין את השולחן או את הכדור. כל מאזין אנושי היה מבין שהמילה "הוא" מציינת את השולחן. אבל כדי להבין זאת הוא צריך לשלב את הידע שלו על חומרים עם הבנת השפה, משימה שעדיין רחוק היום שבו יוכלו מכונות לעמוד בה בהצלחה. שלושה מומחים, הקטור לָוֶסְק, אֶרְנֶסְט דייוויס ולאורה מורגנשטרן, כבר פיתחו מבחן הבנוי סביב משפטים כאלה, וחברת Nuance Communications העוסקת, בין השאר, בזיהוי דיבור מציעה פרס בסך 25,000 דולר למערכת הראשונה שתצליח לעבור אותו.
כפי שאין מבחן יחיד ליכולת אתלטית, לא יכול להיות מבחן אחד ויחיד למציאותה של תבונה.
אנחנו מקווים לכלול במבחן שלנו עוד הרבה אתגרים נוספים. טבעי שאחד ממרכיביו יהיה אתגר הבנה שבו ייבחנו המכונות על יכולתן להבין תמונות, וידאו, דיבור וטקסט. צ'רלס אורטיז ג'וניור, מנהל המעבדה לבינה מלאכותית ועיבוד שפה טבעית בחברת Nuance, מציע אתגר בנייה שיבחן יכולות תפיסה של הסביבה ויכולות פיזיות מעשיות: שני יסודות חשובים של התנהגות תבונית שלא נכללו כלל במבחן טיורינג המקורי. פיטר קלארק ממכון אלן לבינה מלאכותית הציע לתת למכונות את אותם מבחנים סטנדרטיים שעוברים תלמידי בתי ספר במדעים או בתחומים אחרים.
מלבד במבחנים עצמם דנו משתתפי הכנס בדרישות הכלליות שבהן צריך לעמוד כל מבחן כדי להיחשב למבחן טוב. גוּרוּדוּת' בָּאנָוָאר ועמיתיו ב-IBM, לדוגמה, הדגישו שמחשבים צריכים לבנות את המבחנים עצמם. סטיוארט שִיבֶּרמאוניברסיטת הרווארד הדגיש את יסוד השקיפות: כדי שהמבחנים באמת יעזרו לקדם את התחום, יש להעניק פרסים רק למערכות פתוחות (כלומר כאלה שיעמדו לרשותה של כל קהילת העוסקים בבינה מלאכותית) וניתנות לשחזור.
מתי יצליחו מכונות לעמוד באתגרים שאנחנו מציעים? אין איש יודע. אבל יש מי שכבר רואים חלק מאירועי המבחן ברצינות, ולהצלחה בהם יכולות להיות השלכות משמעותיות על עולמנו. רובוט שהתמודד בהצלחה עם מבחן הבנייה, לדוגמה, יוכל להקים מחנות זמניים לבני אדם עקורים, על פני כדור הארץ או על פני כוכבי לכת רחוקים. מכונה שתצליח לעבור את אתגר סכמת וינוגרד ומבחן של כיתה ד' בביולוגיה אולי תקרב אותנו להגשמת החלום על מכונות שיהיו מסוגלות לקרוא את כמויות החומר האדירות שמכילה הספרות המדעית בתחום הרפואה ולאחד את כל הידע הגלום בה. זה יוכל להיות צעד ראשון וחשוב לקראת מציאת תרופה לסרטן או לעבר הבנת המוח. כמו בכל תחום, גם בתבונה מלאכותית נחוצות מטרות ברורות. מבחן טיורינג היה התחלה נחמדה, אבל כעת הגיע הזמן לבנות דור חדש של אתגרים.
11 תגובות
יריב
אני מסכים איתך שהאות דומה. אבל אם הניורון הרבה יותר גדול אז ההשהיות יהיו שונות ולכן ההתנהגות תהיה שונה.
בקשר לחציית המוח – השאלה שלך נכונה, ומניסויים שעשו לא מזמן מתברר שאין בדיוק שתי תודעות. הנה קישור מעניין:
https://aeon.co/ideas/when-you-split-the-brain-do-you-split-the-person?utm_source=Aeon+Newsletter&utm_campaign=ddbff61ecc-EMAIL_CAMPAIGN_2017_09_26&utm_medium=email&utm_term=0_411a82e59d-ddbff61ecc-69476645
בכלל – אני מאד מציע לקרוא מאמרים של האתר הזה – מאד מעניין (בכל מיני נושאים).
ניסים,
הפולסים החשמליים שנוצרים בפרוייקט הדמיית מוח האדם הם כל כך דומים לפולסים האמיתיים שקשה להבדיל מי מהם הוא הפולס שנמדד במעבדה ומי הפולס שנוצר בהדמייה.
כן, לאדם חצוי מוח (ויש לא מעט כאלו, אנשים שהקשר בין שתי ההמיספרות שלהם נותק בניתוח) יש שתי תודעות, יש גם ניסויים מאוד מעניינים שמדגימים זאת.
אבל יש כאן נקודה מעניינת אחרת, איך תודעה כזו שיש בה רק מחצית מתאי העצב (גם בקליפת המוח) עדיין מצליחה לתפקד (לפחות כלפי חוץ) כמו תודעה של אדם רגיל?
יריב
זה אומר שצריך לדמות במדוייק את האותות ברמת צורת אות, יחס אות לרעש, תזמונים, זמני השהייה וכן הלאה. צריך לדמות את ההשראות בין אותות שונים (אם קיים. ואם לא, אז אסור שיהיה בהדמייה). כלומר – ההדמיה של כל ניורון הוא מאד מורכב, ואני לא חושב שאנחנו מבינים היום כמה הוא מורכב.
אכן, הצליחו לייצר "ניורון סינטטתי" שיכול להתממשק לניורונים אמיתיים, אבל גודלו כסנטימטר מעוכב. כלומר – פי טריליון מגודלו של ניורון אמיתי.
אני בהחלט חושב שאפשר לדמות את הניורונים במוח, אבל בלי לבנות ניורון שתואם גם פיסית לניורון אמיתי, לא נתקרב למוח אדם.
אבל …. כמו שאמרתי מזמן, תודעה זה משהו אחר לגמרי. תודעה מזמן יצרנו. מצד שני, אין לנו באמת מושג מה הוא התודעה של האדם. אשאל אותך שאלה פשוטה – האם לאדם חצוי מוח יש שתי תודעות?
ניסים,
עד כמה שזכור לי מההרצאות של עידן שגב (וידידו הנרי מרקרם שכבר לא מנהל את הפרויקט) ישנה הקפדה גדולה מאוד בפרוייקט הזה לבנות רשת עצבית שגם המבנה הטופוגרפי שלה תואם לזה שקיים במציאות והם מדגימים זאת גם באופן ויזואלי:
https://www.youtube.com/watch?v=HN1iX_3CXLY
לכן כן אמורה להיות לדעתי תאימות למנגנון הניווט במוח מבחינת יחסי המרחקים בין הנוירונים והפיזור ביניהם. אם במוח המרחק בין נוירון A ל B גדול פי 2.7 מהמרחק בין נוירון A ל C אז גם בהדמייה היחס הזה ישמר אפילו אם ההדמייה היא בגודל של בניין.
יריב
חפש Grid Cells. יש גם בויקיפדיה.
אני לא חושב ששום פרוייקט מממש כזה דבר היום, כי זה מחייב שהגודל של הניורונים והפיזור שלהם במרחב יהיה כמו במוח.
בעצם אני דיי בטוח שזה מה שקורה בפרוייקטים כמו ״פרוייקט מוח האדם״, אני יודע שמאוד מקפידים שם על הדמייה פיזיקלית מדוייקת של מבנה הרשת העצבית במוח, אני בטוח שגם בהדמייה שלהם לנוירונים רחוקים יותר יקח יותר זמן להעביר ביניהם את הסיגנלים החשמליים.
ניסים,
״במנגנון זה המרחק בין ניורונים מדמה את המרחק במציאות״
זה מעניין, פעם ראשונה שאני שומע על זה. האם יש לך איזה קישור בנושא? בכל מקרה אני לא רואה סיבה שלא נוכל לדמות זאת גם ברשת עצבית ממוחשבת, אני מעריך שככל שהמרחק בין הנוירונים גדול יותר כך לוקח לפולסים יותר זמן להגיע לנוירונים השכנים, אני לא רואה שום סיבה שלא נוכל לדמות זאת גם במחשב ולגרום לפולסים בסימולציה להתנהג בצורה דומה (כלומר לעכב את הגעתם בהתאם למרחק).
יריב
אני מסכים איתך שאלו שתי בעיות שונות. הבנת הנקרא זה רעיון טוב, אבל אנחנו לא מתקרבים לקצה הקרחון של הבנת הנקרא. אנחנו לא יודעים היום לפתור בעיה שהיא בסדרי גודל יותר קלה: תרגום טקסט. וכל בעיה שאנחנו כן (חושבים ש)פתרנו – זה לא בצורה שהמוח שלנו עובד.
אחד המנגנונים במוח "מנווט" ע"י זה שהוא מחזוק מפה פיסית של הסביבה. במנגנון זה המרחק בין ניורונים מדמה את המרחק במציאות. האם נראה לך שיש היום מערכת עצבית סינטטית שיכולה לעבוד ככה? הרי הטענה היא שכל מה שחשוב זה הקישורים ורמות החיבור….
ניסים,
אני יודע שישנם מקרים של אוטיסטים שהם מאד אינטליגנטים בתחום מאד מסויים (למשל ביצוע של פעולות מתמטיות מסובכות בראשם ללא מחשבון) אך בשאר התחומים הם עדיין… אוטיסטים:
https://he.m.wikipedia.org/wiki/תסמונת_סוואנט
בכל מקרה כבר מזמן טענתי שמבחן טיורינג אמיתי לאינטיליגנציה מלאכותית חייב לכלול מגוון רחב של תחומים ולא רק שיחה עיוורת דרך מחשב. לדוגמא הייתי מצפה מבינה מלאכותית ברמה של אדם לעבור בהצלחה מבחני IQ ומבחנים פסיכומטריים ופסיכוטכנים ברמה שבני אדם מתמודדים איתם, לדעת לקרוא סיפור ואז לענות בהצלחה על שאלות הבנה, להצליח לפתור חידות היגיון וכדומה.
לזה אני בטוח שנגיע, אבל השאלה הבאמת מעניינת היא איך ניתן להוכיח שלבינה מלאכותית שיצרנו יש באמת מודעות עצמית? ורגשות? נכון שהיא יכולה לספר לנו בצורה מאד משכנעת שיש לה את כל אלו, אך כיצד ניתן להוכיח שזה באמת כך? ושהיא אכן חווה את הדברים האלו באופן סובייקטיבי כפי שאנחנו חווים אותם? זו שאלה מאד מעניינת לדעתי.
לפי המתואר כאן, אדם אינטליגנטי הסובל מאוטזים, הוא לא אינטילגנטי….
אז מה עשינו?
נראה בהחלט סביר שעבור מערכות בינה בעלות יכולת גבוהה נצטרך מגוון מבחנים כדי לבחון אותה בנוסף
אולי נראה טרוויאלי אבל במערכת בינה מלאכותית רחבה מתקדמת יהיה ניתן לשאול אותה שאלה פשוטה
האם יש לך רגשות האם את אנושית, זה די ברור שמערכת בינה מלאכותית רחבה ברמה גבוהה תוכל לעבוד עלינו אבל זה גם בהחלט אפשרי ואולי יותר סביר שהיא פשוט תתן לנו את האבחנה העצמית שהיא לא חשה כלום אלה רק יוצרת סימולציה התנהגותית את זה היא תוכל "להבין" מהתבוננות ביצורים חיים ובמיוחד באדם,
בדיוק כמו אדם שהוא עיוור צבעים שבאיזה שלב בחיים הראשוני מבין שמשהו חסר לו בתמונה משהו שכולם מדברים עליו והוא פשוט לא רואה אותו,
יש עוד שאלה מענינת האם סימולציה עצמאית בהנחה שהיא לא חשה ברגשות ללא התחושה הפניימית הסוביקטיבית יכולה לאורך זמן להמשיך להתנהג כאנושית או שבאיזה שהוא שלב ההתנהגות שלה תתפלג לכיוון אחר כמו איזה משוואה מתמטית שונה כי חסר לה חלק במשוואה, כאילו את מנסה לחכות מיים עם נוזל אחר
כאשר בתנאים מסוימים ההתנהגות תהיה דומה אבל במצבים אחרים יהיה הבדל כולל באינטרקציה עם חומרים אחרים.