סיקור מקיף

"היינו חייבים לפתח תחומים בשטחים כגון הבנת השפה, הבנת הנשמע וכיצד להתמודד בתחרות ויכוחים"

כך אומרת בראיון לאתר הידען שילה אופק קאופמן, מנהלת מחלקת חקר שפה טבעית בחטיבת הבינה המלאכותית במעבדת המחקר של IBM בחיפה המספרת על ההתקדמויות המדעיות של חוקרי IBM חיפה בדרך לפיתוח ה – Debater

סיקור מורחב באתר הידען:

שילה אופק קאופמן, מנהלת מחלקת חקר שפה טבעית בחטיבת הבינה המלאכותית במעבדת המחקר של  IBM בחיפה. צילום: אור קפלן
שילה אופק קאופמן, מנהלת מחלקת חקר שפה טבעית בחטיבת הבינה המלאכותית במעבדת המחקר של IBM בחיפה. צילום: אור קפלן

שילה אופק קאופמן, מנהלת מחלקת חקר שפה טבעית בחטיבת הבינה המלאכותית במעבדת המחקר של IBM בחיפה שהיתה שותפה בפיתוח Project Debater מספרת לאתר הידען על הפרויקט, ועל הויכוח שהתקיים בין המחשב לוכחנים מקצועיים שלשום בגבעתיים.

אופק קאופמן עובדת 14 שנה ב-IBM, ולפני כן למדה מדעי המחשב ו-MBA בטכניון.

איך הופכים מחשב למומחה ברמה גבוהה לשפה האנגלית, עד לכדי ניסוח משפטים מורכבים?

"חקר השפה הוא תחום קיים המתפתח במהירות. ישנן טכנולוגיות די מבוססות בתחום של ניתוח חלקי דיבר, מבנה משפט, זיהוי ישויות כלומר שמות של אנשים ומקומות. הקפיצה המשמעותית שעשינו במהלך פיתוח ה – Debater  היה בהבנה עמוקה של השפה. ומעבר לזה יש את היכולת לייצר טקסט שהוא גם ארוך, גם מביע עמדה, גם קוהרנטי, אדם מבין את הרצף הלוגי של הדברים והוא גם משכנע. נדרשנו להקנות גם למחשב את אותה יכולת. כל זה נדרש כדי שהמערכת תוכל לנסח את הנאום הראשון."

"מרכיב חשוב הוא החיפוש במאגרי המידע המערכת סורקת מאגר מידע של 300 מיליון מסמכים, 10 מיליארד משפטים – ומשלבת אותם יחד לנאום קוהרנטי ומשכנע. זה מתחיל בחיפוש כמו שאנו מכירים מהאינטרנט אבל הוא נדרש לא רק למצוא תוכן שמדבר על הנושא אלא גם לזהות טיעונים, להבין שמשפט כלשהו הוא טיעון. רק להסביר מהו המושג לא מספיק בשביל דיבייט, אלא צריך למצוא תוכן ארגומננטטיבי, כלומר שמשפט מסוים מכיל טענה ולא סתם משפט שמזכיר את הנושא."

אחר כך יש להבין האם הוא טוען תומך בטענה שאנו מנסים לדון בה או תוקף אותה. לפעמים המשפט יכול גם לא להזכיר אף מילה ממילות המפתח. אפשר להבין זאת או מתוך הקשר של פסקה או מתוך הבנה סמנטית שמדובר בקונספט גבוה יותר, המתקשר לנושא שעליו אנו דנים. זאת בנוסף לתובנה שטיעון הוא חלק מקונספט שלם שהמחשב הוכחן רוצה להעלות בדיון, והמערכת צריכה להבין את העמדה עליה היא נדרשת להגן.

לסיכום חלק זה אומרת אופק-קאופמן, המערכת מייצרת נאום של מספר דקות, מוצאת מקורות, ציטוטים של מחקרים ושל אנשים מובילים בתחום, בודקת האם הם תואמים או תוקפים את הנושא ולבנות מכל זה טיעון עקבי ומאורגן, שהמשפטים בו מתחברים היטב.

 

וכיצד מייצר ה – Debaterאת התשובה לטיעון האנושי?

"כאן נדרשנו לפתח טכנולוגיות בתחום הבנת הנשמע. היום העוזרים הממוחשבים וצ'טבוטים למיניהם יודעים לקבל פקודה בת משפט אחד, מנתחים אותו ונותנים תשובה קצרה או מבצעים את הבקשה. פה ה – Debater צריך להאזין לנאום בן ארבע דקות של אדם שמדבר לעיתים מהר, ולהבין גם את האינטונציה."

"השלב ראשון היה להשתמש במערכות Speech to Text שהופכת את דברי הווכחן האנושי לטקסט כתוב. לאחר מכן מנתחים את הטקסט ומנסים להבין מה התמצית של דברי האדם, מה הקונספטים הגבוהים יותר שהוא תוקף, ואז להכין את הנאום הבא שמתייחס למה שאמר, לעיתים ה – Debater מנסה לתקוף את טענותיהם של יריבו אך לא תמיד, לעיתים הוא פשוט מרחיב לטיעונים שהעלה הוא עצמו בנאום הקודם. תחום נוסף שהיינו צריכים להמודד איתו הוא מידול של עולם הדיבייטים – להבין איך מנהלים דיבייט. זה מה שלמדנו תוך כדי ההתנסות והעבודה עם הדיבייטרים האנושיים. למדנו איך הם תוקפים את הנושא וכיצד להבין ניוואנסים."

 

 לאחר הויוכחים ההתרשמות שלי היא שה – Debater לא עובר את מבחן טיורינג, מה התכניות שלכם?

אופק קאופמן: "הפיתוח של המערכת לא הסתיים, הגענו למצב שה – Debater  בשל מספיק כדי להציג אותו ולהראות את היכולת שהגענו אליה עד כה. אכן היכולת שלו לשאת את הנאום הראשון הרבה יותר טובה מאשר היכולת שלו להפריך את טענות הדיבייטור האנושי, ויש פה משחק ברמת הביטחון. אנחנו הוליכם על בטוח כדי שהמערכת תתקוף טענה של היריב כשהיא הבינה את טענותיו של היריב ובטוחה שהיא יכולה להגיב נכון."

 

"זו הנקודה שיש בה הרבה עבודה. מידת הביטחון בהבנת דברי הדובר תלויה כמובן בחומר שיש ל= Debater על הנושא הספציפי. היא מקשיבה ליריב ובודקת האם יש לה מספיק חומר שמאפשר לה להפריך או לסתור את מה שאמר. אם אין לה היא פשוט מחזקת את טענותיה הקודמות."

לסיכום אומרת אופק קאופמן כי מטרת הפרויקט שהעלו ד"ר נועם סלונים וד"ר רנית אהרונוב, ואשר בזכותה התקבל על ידי IBM העולמית היה בדיוק לפרוץ את גבולות המדע, אם כי בשלבים המתקדמים יותר של התחרות היה צורך גם להסביר כיצד אפשר לממש את המערכת וגם מה יהיה הפן המסחרי שלה.

מרכז הכובד של הפיתוח היה בחיפה.

שיתוף ב print
שיתוף ב email
שיתוף ב whatsapp
שיתוף ב linkedin
שיתוף ב twitter
שיתוף ב facebook

2 תגובות

  1. לדעתי- לא קיימת היום תוכנת AI שיכולה לעבור מבחן טיורינג, קיימים רק אנשים שלא יודעים איך לדבר

    עם התוכנות בצורה מספיק מתוחכמת כדי לחשוף את העובדה שהן מלאכותיות.

  2. נשמע מגניב, כמו שחמט עם מחשב רק כדיבייט.
    אחכה עד שיצא ואשמח לנסות

כתיבת תגובה

האימייל לא יוצג באתר.

לוגו אתר הידען
דילוג לתוכן