סיקור מקיף

“היינו חייבים לפתח תחומים בשטחים כגון הבנת השפה, הבנת הנשמע וכיצד להתמודד בתחרות ויכוחים”

כך אומרת בראיון לאתר הידען שילה אופק קאופמן, מנהלת מחלקת חקר שפה טבעית בחטיבת הבינה המלאכותית במעבדת המחקר של IBM בחיפה המספרת על ההתקדמויות המדעיות של חוקרי IBM חיפה בדרך לפיתוח ה – Debater

סיקור מורחב באתר הידען:

שילה אופק קאופמן, מנהלת מחלקת חקר שפה טבעית בחטיבת הבינה המלאכותית במעבדת המחקר של  IBM בחיפה. צילום: אור קפלן
שילה אופק קאופמן, מנהלת מחלקת חקר שפה טבעית בחטיבת הבינה המלאכותית במעבדת המחקר של IBM בחיפה. צילום: אור קפלן

שילה אופק קאופמן, מנהלת מחלקת חקר שפה טבעית בחטיבת הבינה המלאכותית במעבדת המחקר של IBM בחיפה שהיתה שותפה בפיתוח Project Debater מספרת לאתר הידען על הפרויקט, ועל הויכוח שהתקיים בין המחשב לוכחנים מקצועיים שלשום בגבעתיים.

אופק קאופמן עובדת 14 שנה ב-IBM, ולפני כן למדה מדעי המחשב ו-MBA בטכניון.

איך הופכים מחשב למומחה ברמה גבוהה לשפה האנגלית, עד לכדי ניסוח משפטים מורכבים?

“חקר השפה הוא תחום קיים המתפתח במהירות. ישנן טכנולוגיות די מבוססות בתחום של ניתוח חלקי דיבר, מבנה משפט, זיהוי ישויות כלומר שמות של אנשים ומקומות. הקפיצה המשמעותית שעשינו במהלך פיתוח ה – Debater  היה בהבנה עמוקה של השפה. ומעבר לזה יש את היכולת לייצר טקסט שהוא גם ארוך, גם מביע עמדה, גם קוהרנטי, אדם מבין את הרצף הלוגי של הדברים והוא גם משכנע. נדרשנו להקנות גם למחשב את אותה יכולת. כל זה נדרש כדי שהמערכת תוכל לנסח את הנאום הראשון.”

“מרכיב חשוב הוא החיפוש במאגרי המידע המערכת סורקת מאגר מידע של 300 מיליון מסמכים, 10 מיליארד משפטים – ומשלבת אותם יחד לנאום קוהרנטי ומשכנע. זה מתחיל בחיפוש כמו שאנו מכירים מהאינטרנט אבל הוא נדרש לא רק למצוא תוכן שמדבר על הנושא אלא גם לזהות טיעונים, להבין שמשפט כלשהו הוא טיעון. רק להסביר מהו המושג לא מספיק בשביל דיבייט, אלא צריך למצוא תוכן ארגומננטטיבי, כלומר שמשפט מסוים מכיל טענה ולא סתם משפט שמזכיר את הנושא.”

אחר כך יש להבין האם הוא טוען תומך בטענה שאנו מנסים לדון בה או תוקף אותה. לפעמים המשפט יכול גם לא להזכיר אף מילה ממילות המפתח. אפשר להבין זאת או מתוך הקשר של פסקה או מתוך הבנה סמנטית שמדובר בקונספט גבוה יותר, המתקשר לנושא שעליו אנו דנים. זאת בנוסף לתובנה שטיעון הוא חלק מקונספט שלם שהמחשב הוכחן רוצה להעלות בדיון, והמערכת צריכה להבין את העמדה עליה היא נדרשת להגן.

לסיכום חלק זה אומרת אופק-קאופמן, המערכת מייצרת נאום של מספר דקות, מוצאת מקורות, ציטוטים של מחקרים ושל אנשים מובילים בתחום, בודקת האם הם תואמים או תוקפים את הנושא ולבנות מכל זה טיעון עקבי ומאורגן, שהמשפטים בו מתחברים היטב.

 

וכיצד מייצר ה – Debaterאת התשובה לטיעון האנושי?

“כאן נדרשנו לפתח טכנולוגיות בתחום הבנת הנשמע. היום העוזרים הממוחשבים וצ’טבוטים למיניהם יודעים לקבל פקודה בת משפט אחד, מנתחים אותו ונותנים תשובה קצרה או מבצעים את הבקשה. פה ה – Debater צריך להאזין לנאום בן ארבע דקות של אדם שמדבר לעיתים מהר, ולהבין גם את האינטונציה.”

“השלב ראשון היה להשתמש במערכות Speech to Text שהופכת את דברי הווכחן האנושי לטקסט כתוב. לאחר מכן מנתחים את הטקסט ומנסים להבין מה התמצית של דברי האדם, מה הקונספטים הגבוהים יותר שהוא תוקף, ואז להכין את הנאום הבא שמתייחס למה שאמר, לעיתים ה – Debater מנסה לתקוף את טענותיהם של יריבו אך לא תמיד, לעיתים הוא פשוט מרחיב לטיעונים שהעלה הוא עצמו בנאום הקודם. תחום נוסף שהיינו צריכים להמודד איתו הוא מידול של עולם הדיבייטים – להבין איך מנהלים דיבייט. זה מה שלמדנו תוך כדי ההתנסות והעבודה עם הדיבייטרים האנושיים. למדנו איך הם תוקפים את הנושא וכיצד להבין ניוואנסים.”

 

 לאחר הויוכחים ההתרשמות שלי היא שה – Debater לא עובר את מבחן טיורינג, מה התכניות שלכם?

אופק קאופמן: “הפיתוח של המערכת לא הסתיים, הגענו למצב שה – Debater  בשל מספיק כדי להציג אותו ולהראות את היכולת שהגענו אליה עד כה. אכן היכולת שלו לשאת את הנאום הראשון הרבה יותר טובה מאשר היכולת שלו להפריך את טענות הדיבייטור האנושי, ויש פה משחק ברמת הביטחון. אנחנו הוליכם על בטוח כדי שהמערכת תתקוף טענה של היריב כשהיא הבינה את טענותיו של היריב ובטוחה שהיא יכולה להגיב נכון.”

 

“זו הנקודה שיש בה הרבה עבודה. מידת הביטחון בהבנת דברי הדובר תלויה כמובן בחומר שיש ל= Debater על הנושא הספציפי. היא מקשיבה ליריב ובודקת האם יש לה מספיק חומר שמאפשר לה להפריך או לסתור את מה שאמר. אם אין לה היא פשוט מחזקת את טענותיה הקודמות.”

לסיכום אומרת אופק קאופמן כי מטרת הפרויקט שהעלו ד”ר נועם סלונים וד”ר רנית אהרונוב, ואשר בזכותה התקבל על ידי IBM העולמית היה בדיוק לפרוץ את גבולות המדע, אם כי בשלבים המתקדמים יותר של התחרות היה צורך גם להסביר כיצד אפשר לממש את המערכת וגם מה יהיה הפן המסחרי שלה.

מרכז הכובד של הפיתוח היה בחיפה.

4 תגובות

  1. בלשנות עצברית

    כמו שהפיזיקה העצברית באה במקום הפיזיקה של ניוטון, כך הבלשנות העצברית באה במקום הבלשנות של חומסקי.

    ניוטון האמין שקיים במציאות הפיזיקלית רעיון דמיוני ושמו כוח משיכה, וחומסקי האמין כי בני אדם יוצרים באופן טבעי שפות בעלי תחביר קבוע

    ניוטון הטעה את הפיזיקאים במשך 300 שנים, וחומסקי הטעה את הבלשנים במשך 80 שנים..

    הבלשנות העצברית חופשיה ואין בה תחביר קבוע או כללי דקדוק מסוימים.
    הבלשנות העצברית פשוטה ומובנת מאליה ,והיא מבוססת על ידיעתו הטבעית של האדם.

    הבלשנות העצברית פותחת בזיהוי איברים בגוף האדם, המאפשרים לו לדבר. (גרון, פה , לשון)

    גרון, פה , ולשון, הם פסנתר טבעי של 22 צלילים

    פסנתר טבעי שייך לאדם , בעל ידיעה טבעית

    האדם בעל הידיעה הטבעית, המציא לעצמו שפה המבוססת על הצלילים, שמפיק הפסנתר הטבעי.
    וכך מתואר התהליך של יצירת שפה.

    אדם שותק בעל ידיעה טבעית נוגע בגוש קרח, ובאורח פלא מגיעה אליו ידיעה טבעית ברורה.
    האדם השותק פתאום הבין שהוא יודע משהו.

    אין כל דרך לתאר את הידיעה הזו מכיוון שהאדם עוד לא המציא מלים. ואף על פי שהמלים עוד לא הומצאו, האדם שנגע בגוש קרח ידע לפתע ידיעה חדשה מופלאה וברורה.
    וכאן התרחש נס, והאדם השותק הבין שצריך לתת שם לידיעה ברורה זו .

    האדם השותק הזה הוא אדם בעל ידיעה טבעית הטבועה בו, והוא ידע כי הפסנתר הטבעי שלו יכול לספק צלילים , שיכולים לשמש כשם של
    הידיעה הטבעית האמורה.

    האדם השותק הזה בחר שם קצר, הנובע משני צלילים של הפסנתר הטבעי שלו, צליל ק וצליל ר

    וכך קרה, שצירוף שני הצלילים (קר) הפך להיות שם של ידיעה טבעית, הבאה אל האדם בעקבות מגע בגוש קרח.

    כר מתחילה היצירה של שפה אנושית, שהיא שפת שמות של ידיעות טבעיות.
    כל תנאי היצירה נמצאים באדם השותק.
    כושר ההמצאה טבוע באדם השותק , הידיעה הטבעית טבועה באדם השותק , והפסנתר הטבעי הוא חלק מגופו של האדם השותק..

    כל אדם יכול ללמוד שפה של ידיעות טבעיות. שפה זו מחייבת את האדם הרוצה ללמוד, לעשות מעשה של מגע בגוש קרח, כמו האדם השותק,

    אחרי זה יגיע הלומד, אל שני הצלילים ק ר של הפסנתר הטבעי שלו , ואז הוא יבין כי זה השם של הידיעה הטבעית שבאה אליו, בעקבות מגע בגוש קרח.

    השם של ידיעה טבעית נבחר באופן שרירותי,
    וכל צירוף של צלילים יכול להתאים לכך.

    צירוף הצלילים (ח ם ) נבחר להיות שם של ידיעה טבעית, הבאה באורח פלא אל האדם המתקרב למדורה.
    גם צירוף הצלילים ח ם נבחר באופן שרירותי.

    כך נוצרת שפת בני אדם , המבוססת על ידיעות טבעיות הבאות אליהם, בעקבות מעשים שהם עושים במציאות הפיזיקלית.
    כמו ( לנגוע, ללכת ,לקפוץ, לטעום , להריח )וכו’
    שפה זו היא שפת שמות של ידיעות טבעיות
    הבאות אל בני האדם ,בעקבות מעשים ממשיים שהם עושים במציאות הפיזיקלית.

    נוגעים ובאה ידיעה טבעית, מריחים ובאה ידיעה טבעית אחרת, רואים ובאה ידיעה טבעית
    אחרת, טועמים ובאה ידיעה טבעית אחרת, ועוד ,

    עתה נשאר לבחור צלילים מהפסנתר הטבעי, כמו
    צלילי ח ל ק , או צלילי מ ח ו ס פ ס ,או צלילי מ ת ו ק , ואלה יהיו שמות של חלק מהידיעות הטבעיות שבאו אל בני האדם, בעקבות המעשים שהם עשו. במציאות הפיזיקלית.

    ככה נוצרת שפה של בני אדם, שהיא שפת שמות של ידיעות טבעיות. כל מלה בשפה האנושית היא
    שם של ידיעה טבעית- הבאה אל האדם ,בעקבות מעשה ממשי שהוא עושה במציאות הפיזיקלית.

    אי אפשר ליצור שפה אנושית בעזרת קולות הבוקעים מהגרון, כי הקולות הם סתם רעש.

    אם הקולות הם שמות של ידיעות טבעיות הבאות בעקבות מעשה במציאות הפיזיקלית, אז השפה נוצרת מיד , ואפשר להשתמש בה.
    כל הבלשנים ב 100 השנים האחרונות, השתמשו ברעש המלים הבוקע מגרונם, כדי ליצור שפה אנושית ולהסביר אותה.

    כל הבלשנים האלה נכשלו. ובעקבות הכישלון הזה הופיע חוק עצברי האומר:
    אי אפשר לחקור שפה באמצעות המלים שלה.

    הבלשנות העצברית התחילה ליצור שפת בני אדם, שהיא שפת שמות של ידיעות טבעיות.
    בחירת השמות מתקיימת בעזרת הפסנתרים הטבעיים של בני אדם, המסוגלים להפיק הרבה צלילים כמו צליל א , צליל ב , צליל ג וכן הלאה.

    בני אדם המציאו בקלות אלפי שפות, כיוון שהם
    ידעו – ששפה ממציאים במעשים, ולא בדיבורים.

    הבלשנים של 100 השנים האחרונות, לא ידעו ששפה ממציאים במעשים, והם דיברו, ודיברו,
    ודיברו, והוציאו רעש מגרונם – שנשאר רעש.
    הרעש הזה לא הצליח להמציא שפה.

    המחקר של עצבר גילה את סוד השפה האנושית, שהיא שפת שמות של ידיעות טבעיות – הבאות אל האדם בעקבות מעשה שהוא עושה,
    כל מעשה כזה מביא אל האדם ידיעה טבעית , והאדם יוצר השפה מעניק שם לידיעה הטבעית .
    הבלשנות העצברית, מול הבלשנות של חומסקי.

    הבלשנות העצברית חדשה לגמרי, והיא שונה לחלוטין מהבלשנות של חומסקי.
    הבלשנות של חומסקי מבוססת על מלים, שהם שרבוטי קווים חסרי פשר , ולכן הכישלון של בלשנות זו צפוי מראש.
    אין שום אפשרות להבין שרבוטי קווים, בעזרת שרבוטי קווים אחרים , ששמם מלים.

    הבלשנות העצברית מבוססת על מעשים ממשיים
    שהאדם עושה, והמעשים האלה מביאים לאדם
    באורח פלא, ידיעות טבעיות.

    לאדם הנוגע בגוש קרח מגיעה ידיעה טבעית ברורה מאוד, והאדם מעניק לה שם שרירותי.
    את השם השרירותי הוא משיג בעזרת הפסנתר הטבעי שלו. המסוגל להשמיע צלילים רבים.

    האדם כבר מכיר את הידיעה הטבעית שהשם של מורכב מצליל ק ומצליל ר
    כל התהליך הזה מתרחש בעזרת בינה טבעית.
    לרובוט הנוגע בגוש קרח, אין בינה טבעית , ואין ידיעה טבעית.
    לרובוט יש בינה מלאכותית, והוא יכול למדוד את הטמפרטורה של המגע, אבל אין לו ידיעה טבעית ברורה של המגע בגוש קרח.
    ידיעה טבעית ברורה כזו, יש לאדם.

    יש הבדל תהומי בין בינה מלאכותית לטבעית. בינה טבעית שייכת לאדם המשיג ידיעות טבעיות בעקבות מעשה שהוא עושה.

    הבינה המלאכותית היא מוגבלת, ולעולם לא תגיע לבינה טבעית של אדם.

    יש הרבה ציפיות מבינה מלאכותית, והבלשנות העצברית הורידה את רמת הציפיות , לרמה מכנית פשוטה שפועלת, אבל אינה יודעת.

    הבלשנות העצברית היא שיר תהילה לאדם היודע

    א.עצבר

  2. עידן המהפכות המדעיות המבוססות על “ידיעה טבעית” הגיע.

    מדובר על מהפכה בלשנית שגילתה את סוד השפה האנושית.
    ומדובר גם על מהפכה גיאומטרית,שגילתה גיאומטריה חדשה.
    ומדובר גם על מהפכה פיזיקלית, שגילתה פיזיקה חדשה ויקום חדש.

    מחשבים לעולם לא יצליחו לדבר בשפה אנושית, כי אין לחחשבים ידיעה טבעית.

    א.עצבר
    https://nivbook.co.il/product/%D7%9E%D7%A1%D7%A2-%D7%94%D7%A7%D7%A1%D7%9D-%D7%A9%D7%9C-%D7%A2%D7%A6%D7%91%D7%A8-%D7%A2%D7%9C-%D7%9B%D7%A0%D7%A4%D7%99-%D7%94%D7%99%D7%93%D7%99%D7%A2%D7%94-%D7%94%D7%98%D7%91%D7%A2%D7%99%D7%AA/

  3. לדעתי- לא קיימת היום תוכנת AI שיכולה לעבור מבחן טיורינג, קיימים רק אנשים שלא יודעים איך לדבר

    עם התוכנות בצורה מספיק מתוחכמת כדי לחשוף את העובדה שהן מלאכותיות.

  4. נשמע מגניב, כמו שחמט עם מחשב רק כדיבייט.
    אחכה עד שיצא ואשמח לנסות

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.