ידידי ויריבי – IBM הציגה את Project Debater: מערכת AI לתחרויות ויכוחים

מדובר ברובוט המתווכח עם מומחים אנושיים לדיבייטינג כשהוא צריך ללמוד נושא מהתחלה ולחפש במאגרי המידע שלו אחר רמזים לטיעון בן ארבע דקות * כשמפרקים את הבעיה לחלקים, מגלים שברובם היה צורך לפרוץ את חזית המדע * פרופ' כריס ריד, מומחה למדעי המחשב ופילוסופיה אומר כי המחשב יודע לחפש חומר ולהפיק טיעונים, אך כנואם, יש לו הרבה לאן להשתפר

סיקור מורחב באתר הידען:

ד"ר רנית אהרונוב חוקרת במרכז המחקר של IBM בחיפה, ד"ר איה סופר -סגנית נשיא IBM העולמית למחקר תבונה מלאכותית וד"ר נועם סלונים - יוזם ומנהל Project Debater. צילום: אור קפלן — ד"ר רנית אהרונוב חוקרת במרכז המחקר של IBM בחיפה, ד"ר איה סופר -סגנית נשיא IBM העולמית למחקר תבונה מלאכותית וד"ר נועם סלונים – יוזם ומנהל Project Debater ליד "מחשב הפרויקט". צילום: אור קפלן

קול נשי המזכיר את אלכסה של אמזון, או את סירי של אפל, אינטונציה כמו זו של מחשב הדיבור של פרופ' סטיבן הוקינג ז"ל או אולי של האל 9000 מהסרט אודיסיאה בחלל, אבל גם יכולת לבנות טיעון הגיוני ועקבי במשך ארבע דקות, ויכולת פחותה להגן עליו בוויכוח עם מקצוען אנושי בתחום הדיבייטינג. זה הרושם הראשוני מ – Project Debater שהציגה IBM הבוקר (ג') בשלוחת מרכז הפיתוח שלה בגבעתיים. רושם נוסף שקיבלתי ואנשי IBM הודו בו הוא שהמחשב יודע להפיק טיעונים מצוינים, אך מתקשה להגן עליהם ובמיוחד ממעט להתייחס לטיעוני היריבים האנושיים.

הטכנולוגיה של ה – Debater נחשפה לראשונה לעולם לפני שבועיים בסן פרנסיסקו – וכיוון שהפיתוח הוא ישראלי ראו החוקרים בחיפה חשיבות בביצוע הדגמה גם בארץ.

מדובר באתגר גדול מסוג GRAND CHALLENGE שנהגה ומנוהל ממרכז הפיתוח של יבמ בחיפה בתחרות פנימית שערכה החברה לאחר הצלחת ווטסון לנצח במשחק הטלוויזיה המפורסם. באותה תכנית טריוויה היה על המחשב לענות באופן מסוים (לפי כללי התכנית) על שאלה מורכבת.
האתגר הפעם הוא לנצח בתחרות ויכוחים, תחרות המוכרת לכל תלמיד בית ספר במדינות דוברות אנגלית. תחרות המקורית, שני מתחרים מציגים טענה בעד או נגד בסוגיה שהועלתה לדיון, ולאחר מכן כל אחד מהמתחרים מגיב לטיעוני יריבו בשני סבבים.
זה מה שביקשה IBM לממש בתבונה מלאכותית ולעמת אותה עם מיטב המתווכחים האנושים. כמו במשחק הטריוויה המחשב צריך לספק תשובה, אך על התשובה להיות מורכבת ומנומקת. בונה טיעונים ומציגה אותם בנאום בדיבור מסונתז באיכות גבוהה במיוחד, מאזינה לטיעוני הצד השני, מגיבה עליהם בנאום נוסף – וחותמת בנאום סיכום: הכול נעשה בתהליך אוטומטי לחלוטין, באמצעות בינה מלאכותית ועל בסיס גוף תוכן העומד לראשותה.
בהדגמה ניתנה למחשב ולשני דיבייטרים מקצועיים (כל אחד בנפרד), יער בך וחיה גולדליסט אייכלר (ראו כתבה נפרדת) בנושאים המוכרים היטב לקוראי אתר הידען: האם להסכים לכך שהממשלה תגביר את המעקב אחר אנשים עם התפתחות הטכנולוגיה המתאימה (דיבייטור היה חד משמעית נגד, בך בעד) והאם להתיר שימוש בהנדסה גנטית (דיבייטור היה בעד, גולדליסט אייכלר נגד).

Debater קיבל רשימה של 40 נושאים, ובהינתן השאלה העולה לדיון, הוא נדרש בתוך דקות אחדות לנתח את כל מאגרי המידע שלרשותו ולהבין "מי נגד מי". לאחר הצגת הטיעונים בידי המערכת הממוחשבת, עונה לו המתווכח האנושי. גם אז נדרש זמן עיבוד של כמה דקות כדי להפוך את דברי היריב האנושי לטקסט, ולהתחיל לחפש שוב במאגרי המידע אחר תשובה, כפי שראינו, בזה המערכת התקשתה יותר, וחזרה על טיעוניה הראשוניים, כמעט בלי להתייחס לטענות היריבים.

ד"ר נועם סלונים שהיה ההוגה והאחראי על הפרויקט ציין כי לאורך השנים נדרשו החוקרים לפתח יכולות רבות ומגוונות כדי לממש את המערכת. "ראשית – היכולת לכתוב נאום באופן אוטומטי על בסיס נתונים קיימים. המערכת סורקת מאגר מידע של 300 מיליון מסמכים, 10 מיליארד משפטים – ומשלבת אותם יחד לנאום קוהרנטי ומשכנע. יכולת שניה – היא כושר הבנת הנשמע. היכולת להאזין ליריב שמדבר משך כמה דקות בצורה ספונטאנית ומהירה, לעתים תוך הצגת רגש. היכולת השלישית היא ניסיון לבנות מודל לעולם הדילמות האנושיות כפי שהוא משתקף בוויכוחים – דוגמת אלה שאנחנו מנהלים מדי יום. בנינו בסיס ידע שמנסה לנבא את הדילמות האנושיות. המערכת מנסה לזהות טיעונים שאותם תוכל לבסס על בסיס הידע הזה".
ד"ר רנית אהרונוב הדגישה כי מה שמייחד את debater לעומת מכונות משחקים קודמות הוא השוני במערכת החוקים. בניגוד למשחק לוח או משחק טריוויה, ב – Debate מדובר במערכת חוקים פתוחה הרבה יותר. המערכת צריכה להיות מסוגלת לעקוב אחרי הלוגיקה של הטיעונים שאותם מציג הצד השני. כמו כן, אין פונקציה שנותנת ציון לאופן ההתנהלות של המערכת. קשה לקבוע מי ניצח – ואי אפשר להיעזר במספר יעד ברור או בתוצאה מוגדרת ונשאפת. אתגר מהסוג הזה הרבה יותר רלוונטי לעולם של בעיות שאין להן תשובות של שחור או לבן – וזהו למעשה העולם האנושי".

ומוסיף ד"ר סלונים: "פיתחנו למעשה מערכת שמסוגלת לכתוב טור דיעה בעתון. כאן, ניתן להשוות לטכנולוגיית הבינה המלאכותית במסייעים אישיים. בטלפון הסלולארי יש להאזין למשפט אחד, בנושא אחד. כאן – יש להאזין משך ארבע דקות לנאום בנושא טעון רגשית ומוסרית, לזהות רעיונות גם כאשר אינם מובעים באופן מפורש. היכולת האנושית להבין מתי טענה היא בעדנו ומתי היא נגדנו – אינה עניין פשוט כשמדובר במחשב. היא מחייבת הבנה של השפה על כל הניואנסים שלה".

זה אולי האתגר הגדול ביותר שבו היה צורך לפרוץ את חזית המדע, בתחומים כגון למידת מכונה, משום שהמערכת נדרשת להבין הקשרים, את העמדה של הכותבים בנושא גם אם הם לא כותבים אותה במפורש ועוד.

תחום מחקרי חדש – ארגומנטציה חישובית

לדבריו, "יש כאן תחום מחקרי חדש ומסעיר. בעקבות ביולוגיה חישובית ובלשנות חיובית, נולד עתה תחום של טיעון חישובי – ארגומנטציה חישובית. יותר מחמישים קבוצות מחקר כבר פועלות בעולם בתחום הזה".

עודד כהן, סגן נשיא IBM העולמית ומנהל מעבדת המחקר בחיפה, עמד גם הוא על מקומו של ה – Debater כנקודת ציון היסטורית בתעשיית המחשוב ובהיסטוריה של מדעי המחשב. "לפני 20 שנה גבר "כחול עמוק" של IBM על כארי קספרוב. ב – 2011 ניצח מחשב של IBM בתחרות Jepardy! ל – IBM מסורת של הצבת אבני דרך בתעשייה – והגדרת 'אתגרים גדולים', Grand Challenges. גם הפעם, בהחלטה על האתגר הבא התנהלה תחרות בין מעבדות המחקר, ונבחרה הצעה שהגיעה מהמעבדה בישראל. אנחנו חוגגים היום את ההצלחה שלנו: זה עוד לא הסוף, אבל הצלחנו להעמיד משהו מעורר השתאות".
כהן הודה כי התלבט תחילה לנוכח גודל האתגר – ונטיית הלב הראשונה שלו הייתה שלא לעשות זאת. "אלא שהצוות הצליח לשכנע אותי. החששות שלי התבדו, והצוות עשה את מה שהבטיח. זאת תהיה אבן דרך בתעשיית טכנולוגיות המידע ומדעי המחשב. היכולת של המחשב להתמודד תוך הבנת שפה עמוקה, בדיאלוג משולב בחוש הומור, מכונה מול אדם – היא הישג".
ד"ר איה סופר, סגנית נשיא ומובילת המחקר במעבדות IBM בכל העולם בתחום הבינה המלאכותית סיפרה כי "כשהתחלנו את הפרוייקט, זה נראה כמדע בדיוני. היה צוות של חוקרים שהאמין ביכולת להוציא את המדע הבדיוני הזה לפועל. הפעילות הזאת היא חלק מפעילות נרחבת של IBM בעולם ובארץ בתחומי הבינה המלאכותית והבנת שפה טבעית. אנחנו מאמינים ש – AI מציג פוטנציאל עשיה חיובית, ותרומה חיובית לעולם: ככל שנשתמש בה נבטח יותר בה יותר – ונוכל להיעזר בה יותר כדי לקבל החלטות".

סופר הקדימה והבהירה כי הדברים המושמעים על ידי המכונה אינם מוקלטים מראש ואינם מתוסרטים: המשפט המתוסרט היחיד הוא דברי הברכה שבהם פותח המחשב את הדיון, בפניה למתמודד האנושי. קודם לתחילת ה – Debate, התריעה סופר כי המערכת עלולה לטעות ולחזור על עצמה – אלא שההתראה התבררה כמיותרת. לדבריה, "אף על פי שהפרוייקט עודו בשלבי פיתוח, אנחנו מאמינים שיש כאן התקדמות משמעותית – ולכן החלטנו לחשוף את הנושא".

כיוון שונה מזה של גוגל

ראוי לציין כי לעומת המפץ שהביא איתו ווטסון שפתח את תחום התבונה המלאכותית שקודם היה אקדמי טהור, IBM אינה לבד בחזית פיתוח התבונה המלאכותית. גוגל חשפה לאחרונה כי פיתחה טכנולוגיית AI המכונה דופלקס שיכולה לנהל שיחות טלפון בקול טבעי כדי להזמין פגישות ולבצע משימות אחרות. לדברי ד"ר סלונים, Project Debater הרבה יותר מתוחכם מהפתרונות שהוציאו חברות מתחרות, הניגשות לנושא מהכיוון של עוזרים קוליים. "קל מאוד להבין פקודה בת משפט אחד, שיש בה מרכיב ביצועי, לעומת ארבע דקות של טיעונים מופשטים או מורכבים של טוען אנושי."
מקום לשיפור

בכל אופן מרבית הדוברים מטעם IBM הדגישו כי מדובר בשלב ביניים, שבו המערכת מספיק אמינה כדי לחשוף אותה, וברור שיש עוד צורך בפיתוח.

פרופ' כריס ריד – חוקר במכון למדעי המחשב ובמחלקה לפילוסופיה באוניברסיטת דנדי שבסקוטלנד ואשר נכך בהכרזה לפני כשבועיים בסן פרנסיסקו אמר כי Project Debater השיג התקדמות משמעותית בתחומים כגון חיפוש טקסטים לטיעונים (כריית טיעונים) בשילוב עם פתרונות טכניים כגון תיקוני דקדוק הכרוכים בהדבקת חלקי משפט, אבל כנואם, המחשב הוא אפרוח המצייץ את ציוציו הקטנטנים הראשונים.

לדבריו, המערכת כוללת רק את המושג הבסיסי ביותר של מבנה הטיעון, ולעתים קרובות סוטה מהנושא הראשי. הוא לא מתייחס לקהל שלו, וגם לא ליריבו, ואין לו שום דרך לנצל כל אחת ממאות הטכניקות הרטוריות החכמות שעוזרות למתווכחים אנושיים לנצח.
עם זאת, פרופ' ריד וגם הדוברים מ-IBM הדגישו כי מטרת הפיתוח איננה לנצח במועדוני ויכוחים, אלא לסייע לצוותים אנושיים לקבל החלטות טובות יותר, בין שבחדר המצב המשטרתי, בונקר ניתוח המודיעין, או בכיתות הלימוד. הוא מציין לחיוב את הרעיון של הגברת היכולת של מערכות AI לקבל החלטות מבוססות ראיות, אך הוא מעריך שהמרחק לפיתוח טכנולוגיה כזו עדיין גדול.

עוד בנושא באתר הידען:

קטגוריות: בינה מלאכותית
תגיות: ibm, Project Debater, איה סופר, למידת מכונה, מעבדות יבמ בחיפה, נועם סלונים, עודד כהן, רנית אהרונוב, תבונה מלאכותית

אבי בליזובסקי

עורך אתר הידען ([email protected])

לכל הכתבות של המחבר

תגובה אחת

ספקן הגיב:

4 ביולי 2018 בשעה 09:07

מעלה הרהורים על הטבע האנושי,
מהו יכולת הדיון הממוצעת של האדם גם בלי השוואה למערכת ה Debater,
האם הם חוזרים על אותם טענות שוב ושוב בדיון כתשובה ,
מהו אחוז האנשים שהדיון אצלם הוא יותר כסוג של ויכוח תחרותי כך שהם תמיד יבחרו את הטיעון הנגדי
בלי קשר לנושא כך שבאיזה שלב נדמה לך שאתה נמצא בכלל מול תוכנת מחשב סטטית ולא אדם דינאמי,
מה האחוז של האנשים (לפעמים דמגוגים) שמרימים את הקול כדי לשכנע ,
וגם מהצד של ההקשבה מה היכולת הממוצעת להשתכנע מטיעון לוגי מול טיעון שפונה יותר לרגש,

גם מאגר הידע ותפיסות הבסיס הוא חלק חשוב באיכות הדיון או גם הטייה (bias) של אנשים שזה יכול בהחלט להיות גם במערכות שהם הרבה יותר טובות מאדם באיכות ויכולת הדיון , היכולת להטיל ספק לא למען הספק אלה למען חתירה להבנת המציאות שזה היתרון בדיון שבו אתה יכול לשכנע ולהשתכנע זה הופך לסוג של לימוד,

כתיבת תגובה

אתר זו עושה שימוש ב-Akismet כדי לסנן תגובות זבל. פרטים נוספים אודות איך המידע מהתגובה שלך יעובד.