הדיבייטר של IBM הצליח לראשונה להבין ניואנס בנאום של האדם שמולו

כך אומר ד"ר נעם סלונים, העומד בראש צוות פיתוח במהלך כנס THINK 2019 של IBM בסן פרנסיסקו במסגרתו התחרה פרוייקט דיבטר מול אלוף העולם בויכוחי

Project Debater בויכוח מול אלוף העולם בויכוחים, האריש נאטאראג'ן. משמאל, מנחה האירוע, ג'ון דונובן. צילום יח"צ
Project Debater בויכוח מול אלוף העולם בויכוחים, האריש נאטאראג'ן. משמאל, מנחה האירוע, ג'ון דונובן. צילום יח"צ

Project Debater – מחשב הויכוחים של IBM המבוסס תבונה מלאכותית בר השבוע מבחן נוסף, עימות מול האריש נאטאראג'ן, Harish Natarajan בוגר אוניברסיטאות אוקספורד וקיימברידג' בבריטניה, ונחשב לאדם בעל שיא עולמי בנצחונות בתחרויות ויכוחים. גם המנחה היה בעל נסיון בהנחיית ויכוחים, ג'ון דונובן, מגיש טלוויזיה ועיתונאי שזכה בארבעה פרסי אמי על סרטים תיעודיים, ומשמש גם כמנכ"ל מועדון הויכוחים Intelligence Squared U.S. בהמשך השתתפו בפאנל גם ד"ר נעם סלונים וד"ר רנית אהרונוב, האחראים מטעם מרכז המחקר של IBM בחיפה על פיתוח פרוג'קט דיבייטר.

השאלה ששני המתחרים – האנושי והממוחשב קיבלו כמה דקות לפני האירוע היתה האם צריך לסבסד את מערכת החינוך טרום חובה, כאשר על פרוג'קט דיבייטר הוטלה המשימה להגן על ההחלטה ואילו נאטאראג'ן נבחר להציג את הצד שכנגד.

לדיבייטר ולנאטאראג'ן ניתנו ארבע דקות להציג את הטיעון, ואחר כך ארבע דקות נוספות להגיב על דבריו של המתחרה, ולבסוף נדרש כל צד לסכם את עמדתו בשתי דקות. הטיעון העיקרי של התבונה המלאכותית היה שהסבסוד מאפשר למעוטי יכולת לשלוח את ילדיהם לחינוך טרום חובה ולספק להם בסיס להמשך חייהם ואילו נאטאראג'ן טען שסבסוד כזה יגיע בעיקר לבני המעמד הבינוני שממילא שולחים את ילדיהם למסגרות טרום חובה בתשלום.

לדברי סלונים, לראשונה, הדיבייטר הגיב לדברים שלא נאמרו מפורשות, אלא השתמעו מניוואנסים בדבריו של נאטאראג'ן, לפיהם סבסוד יגרום בהכרח לירידת רמת החינוך בגנים הללו. דייבטר הבין זאת והגיב על כך. בשיחה עם אנשים ומחשבים אמר סלונים: אחרי הויכוח אנשים שהיו בקהל אמרו שלא היה ברור להם אם היו צריכים לנחש מי האדם ומי לא, כאשר המכונה הראתה יותר אמפתיה לצרכי האדם. היא לא מודעת בשום צורה אבל הטיעונים שהיא העלתה היו מהסוג הזה, והאריש רק הראה ויכוחים לוגיים, זה היה בלתי צפוי. עם זאת היא לא מתוכננת לעבור את מבחן טורינג. בוודאי לא בשלב הנוכחי. בשלב הזה היא הצליחה לא רע לשמור על קו טיעון אחיד ולזהות את המשפטים הרלוונטיים התומכים בטיעון מבין כל המשפטים שעוסקים בנושא, וגם להבין מהם הביטויים הנרדפים ל-PRE SCHOOL כדוגמת Nursery school או pre education.

הקלטת הויכוח

כיצד זה פועל?
סלונים: "הזכרון של הדיבייטר מכיל כ-40 מיליון מאמרים, ובהם קרוב למיליארד משפטים. כדי שהמערכת תגיב במהירות ולא תצטרך לעבור על כל הזכרון לקראת כל ויכוח, פיתחנו מערכת שיודעת לזהות את המשפטים הרלוונטיים לא משנה באיזה ביטוח השתמשו. התהליך נקרא ויקיפידציה – כלומר כניסה למאמר בויקיפדיה ובקריאה ממנו היא מוצאת את כל הביטויים הנרדפים. הויקיפדיזציה הזו מורצת לפני הויכוחים, כי הדבר דורש מספר ימים, ולאחר מכן, כשהמערכת מקבלת את הנושא של הדיון היא יכולה לשלוף רק את המשפטים שמזכירים את הקונספט."

מה ההבדל בדיון הנוכחי לעומת הויכוחים הראשונים כשהטכנולוגיה הוצגה?

סלונים: "בחודשים האחרונים פיתחנו יכולות נוספות שבהן המערכת הולכת מעבר לקונספט הספציפי של הדיבייט אבל זה לא נוסה אתמול. לדוגמה, הדיבייטר הגן על הצורך בלכידות חברתית. מערכת זו היתה יכולה להביא את הויכוח לשאלה מה עדיף – קפיטליזם או סוציאליזם. המערכת אמורה לגלות זאת בעצמה ולשלב בטיעונים."

גם מנחה האירוע, ג'ון דונובן, כאמור מנחה ויכוחים ותיק, הוסיף בהקשר זה כי לא התקיל את המשתתפים בשאלות המשך, כפי שנעשה בויכוח בין שני בני אדם, כי המערכת עדיין לא מוכנה לכך.

מימין, ד"ר רנית אהרונוב וד"ר נעם סלונים, ממרכז הפיתוח של IBM בחיפה, במהלך מפגש עם עיתונאים בכנס THIINK 2019 בסן פרנסיסקו. צילום: אבי בליזובסקי
מימין, ד"ר רנית אהרונוב וד"ר נעם סלונים, ממרכז הפיתוח של IBM בחיפה, במהלך מפגש עם עיתונאים בכנס THIINK 2019 בסן פרנסיסקו. צילום: אבי בליזובסקי

ואילו אהרונוב הוסיפה בראיון לאנשים ומחשבים כי אין משמעות למבחן טורינג כי הפיתוח לא נועד לפתח מערכת שתתרה בבני אדם אלא לסייע לו. לכל אחד מהצדדים יש את היתרונות שלו – המחשב זוכר כמויות אדירות של מידע ויכול להסביר אותם לאדם, ואילו בני אדם יכולים לנסח קו מחשבה הגיוני ארוך יותר וביחד עם יעשו יותר."
באשר לשאלה כיצד יכולים לבדוק שהמערכת אכן מדוייקת, ענה אהרונוב, כי המפתחים מעבירים את המערכת סדרת הכשרות. כמו כן בודקים כל חלק של המערכת, למשל המנוע שמעריך האם משפט מסויים תומך בטענה או סותר אותה, וכך הלאה בכל המנועים. לאחר שאנו בודקים כל מנוע בנפרד, אנו מנתחים את הויכוחים כדי להבין כיצד פעלה המערכת הכוללת.

שיתוף ב print
שיתוף ב email
שיתוף ב whatsapp
שיתוף ב linkedin
שיתוף ב twitter
שיתוף ב facebook

כתיבת תגובה

האימייל לא יוצג באתר.

דילוג לתוכן