סיקור מקיף

להבין מטפורה

כולנו משתמשים במטפורות כמו "ירד מהפסים" ו"עלה על שרטון" בחיי היום יום ומבינים אותן בקלות, אך האם בעתיד יוכלו גם מחשבים להבין אותן?

מלאך המוות כשלד הנושא מגל. יוצר לא ידוע. מתוך ויקיפדיה
מלאך המוות כשלד הנושא מגל. יוצר לא ידוע. מתוך ויקיפדיה

ישראל בנימיני | מגזין גליליאו

"הפרויקט עומד לעלות על שרטון."
"ההנהגה ירדה מהפסים."
"הוא איבד את הצפון."

מה משותף לכל המשפטים שלמעלה? ראשית, כולם דוגמאות לשימוש במטפורה בשפת יום-יום: מטפורות אינן רק אמצעי ספרותי שבקיאות בו נדרשת רק ממשוררים, מסופרים ומחוקרי ספרות, אלא הן חלק חיוני מהדרך שבה אנו מדברים ומתקשרים.

חיפוש של מטפורות קשה בגלל ההבדל בינן ובין דימויים: המטפורה אינה מציינת במפורש כי מתבצעת השוואה, ואינה מצביעה על המושגים שהיא משווה ביניהם

למשפטים אלה יש גם מכנה משותף נוסף, מכיוון שהמטפורות המופיעות בהם מתייחסות כולן לשדה סמנטי דומה, בכך שהן משתמשות בקישור של הפרויקט, המנהיגות או החיים למושגים הקשורים למסע. המסע יכול להיות של אנייה (העלולה לעלות על שרטון), של רכבת (שעליה להישאר על הפסים) וכו', ובכל מקרה במסע עלינו לדעת באיזה כיוון אנו נעים (ולכן אנו זקוקים, לפחות מטפורית, למצפן). זהו סוג נפוץ מאוד של מטפורות, וקל להיזכר בדוגמאות נוספות ("נגמר לו הסוס" שכיום מפנה את מקומו ל"נגמר לו הדלק", "ההחלטה החדשה היא פניית פרסה", "הקשר ביניהם הוא בתחילת דרכו" ועוד). הבחירה של סוג המסע עשויה להכתיב את המשך האמירה – למשל: "הפרויקט עומד לעלות על שרטון, ולכן אנחנו חייבים להפנות את ההגה".

כמו גיבורו של המחזה "גם הוא באצילים" של מולייר, שדיבר ארבעים שנה פרוזה בלי לדעת מהי, כולנו משתמשים במטפורות מסוג זה ומבינים אותן בקלות – למעשה, אין לנו כל בעיה לעשות כך, אך ניתקל בבעיה קשה אם נידרש להימנע לחלוטין משימוש באמצעים לשוניים כאלה. הדברים אמורים, כמובן, לא במטפורות ספרותיות עמוקות אלא דווקא באותן מטפורות יומיומיות שחוקות (שחלקן אף הפכו ל"מטפורות מתות", כלומר כאלה שהפכו ליחידה לשונית ואיבדו את ההקשר למשמעות המקורית – הביטוי "ראש הממשלה", למשל, כבר אינו מפעיל אצל רוב משתמשיו ושומעיו את האסוציאציות למשמעותה של המילה "ראש" כאיבר בגוף).

לך תבין

בסיפור "הרובוט שנעלם" ("Little Lost Robot", המופיע בין שאר הסיפורים בקובץ "אני, רובוט") שכתב אייזק אסימוב בשנת 1947, אומר אחד המהנדסים לרובוט שעובד איתו "לך לאיבוד!" (במקור האנגלי, "Go lose yourself!"). הרובוט מבין את ההוראה מילולית ומסתיר את זהותו בין עשרות רובוטים הזהים לו במראם החיצוני אף על פי שהוא שונה מהם בתיכנותו, והמתח בסיפור נוצר סביב המאמצים לגלות את אותו רובוט.

אחד מהמבקרים של יצירותיו של אסימוב הצביע על חוסר ההיגיון בסיטואציה המתוארת: האם נוכל לדמיין כי בעבודה משותפת של אנשים ורובוטים לא יידרשו הרובוטים לעתים קרובות להבין אמירות כאלה בצורה שאליה התכוון האדם, במקום הבנה מילולית? למשל, בהתייחס לדוגמא שפתחנו בה, מה יקרה אם הרובוט ישמע כי "חייבים לסובב את ההגה" תוך כדי נסיעה במכונית, כאשר הדובר התכוון בצורה מטפורית לצורך לשנות כמה החלטות? אותו מבקר, ג'וזף פטרוץ' (Patrouch), טען כי חוסר יכולתו של אסימוב לחוש בבעיה זו נובע מכך שאסימוב עצמו נטה לחשוב בצורה מילולית, מה שהתבטא גם בסגנון הכתיבה הישיר וה"נקי" שלו.

אני מעדיף לראות בסיפורו של אסימוב דווקא הצלחה בחיזוי של אחד האתגרים הגדולים בהבנה ממוחשבת של שפות אנושיות – הקושי להבין אמירות שמשמעותן אינן נובעת מהגדרתן המילונית. אפשר כמובן להזין את "המילון" שבו משתמש המחשב במגוון של ביטויים עם משמעותם האמיתית: רק במקרים נדירים מאוד תהיה הכוונה בביטוי "לך לאיבוד" להורות למישהו להיעלם כך שאי אפשר יהיה למצוא אותו.

לרוע המזל, זהו אינו פתרון ברוב המקרים, מכיוון שביטויים כמו "לסובב את ההגה" מופיעים גם בהקשרים מטפוריים וגם בהקשרים מילוליים. אין זו הבעיה היחידה: כמות הביטויים שנזדקק להם באותו "מילון" אינה מוגבלת – בדוגמא שלנו, למשל, היה אפשר גם לומר כי צריך ללחוץ על הבלמים, לפנות פניית פרסה, לנווט בזהירות וכו'. לכן אין די בשיטת "מילון הביטויים", ואין מנוס מהצורך לצייד את המחשב ביכולת כלשהי של הבנת מטפורות.
מיפוי בין מבנים

כבר בתחילת שנות השמונים זיהו מפתחי הבינה המלאכותית את הצורך בהבנת מטפורות. בהתאם לגישה שהיתה רווחת באותה תקופה (גישה הזוכה לתומכים גם כיום), הבנת השפה הטבעית נתפשה כתרגום של הטקסט לתוך עולם לוגי-מתמטי. בעולם זה מובעות אמירות כקישורים בין סמלים מוגדרים-היטב, כך שלמילה אחת עשויים להיות מותאמים סמלים רבים, בהתאם למשמעויותיה האפשריות, ולהפך: סמל אחד עשוי להתאים לביטויים רבים ("ג'ורג' וושינגטון" או "הנשיא הראשון של ארה"ב" או "האדם שפסלו הוא השמאלי ביותר על הר רשמור" − כולם מתייחסים לאותו סמל).

לצורך תרגום כזה נדרש ידע רב על העולם, שגם הוא מובע באותה שפה סימבולית. בגישה זו, טבעי לראות במטפורה התבטאות של מיפוי בין מבנים: אם בעולם של פרויקטים אנו מתייחסים לפרויקט מסוים כמתקדם לפי התוכנית או כנמצא בסיכון לאיחור או לכישלון, ובעולם של הפלגה אנו מכירים סכנה של עלייה על שרטון, טבעי ליצור את האנלוגיה בין המבנה "פרויקט – סכנה – איחור" לבין "הפלגה – סכנה – שרטון". אלמנט הסכנה הוא המאחד בין שני המבנים, והוא המאפשר לנו להבין כי הדובר מביע חשש להצלחתו של הפרויקט. (הערה: המילה "מתקדם" גם היא קשורה למטפורה של פרויקט כמסע: כאמור, קשה מאוד להימנע ממטפורות כאלה כאשר עוסקים במושגים מופשטים. זוהי כמובן אינה הדוגמא היחידה במאמר זה.)

פרויקט ATT-Meta

פרויקט המייצג גישה זו הוא פרויקט ATT-Meta בראשות פרופסור ג'ון ברנדן (Barnden) מאוניברסיטת ברמינגהם באנגליה. הפרויקט מוקדש לתחום של מטפורות העוסקות בייצוגים של מצבים נפשיים. בין השאר, נבנה במסגרת הפרויקט מסד נתונים הכולל יותר מאלף דוגמאות טקסטואליות, וקישורן לקטגוריות של מטפורות כמו "הנפש כמרחב פיזי" ("אני שומר את זה בראש שלי", "פתחתי דלת לתוך חדר נסתר בנפשי"), "הנפש כיצור חי" ("תן למחשבותיך לנוע לכל הכיוונים", "הנפש בוררת את דרכה בזהירות בתוך שדה קוצים"), "מחשבות כדיבור פנימי" ("אמרתי לעצמי", "חלק ממני שלא הכרתי קודם הרים את ראשו במחאה") ועוד.

כפי שאפשר לראות מדוגמאות אלה, הקטגוריות כוללות אמירות "ספרותיות" לצד ביטויים שכיחים ובנאליים, ודוגמא אחת עשויה להשתמש במספר מטפורות בו-זמנית. אף על פי שקל להבין את כוונת הטקסט, הייצוג הסימבולי הנדרש הוא מורכב כתוצאה מהמגוון הגדול של צורות ההבעה והמבנה השונה שכל צורה כזו יכולה לעטות. הפרויקט משתמש בייצוגים סימבוליים אלה כדי לזהות התייחסויות מטפוריות כאלה, לעבד אותן ולהבינן.

אחד מחברי צוות הפרויקט מצא חיזוק לצורך בהבנת מטפורות באתגרים של "גרירה טקסטואלית" – מטלת ניתוח טקסט שהציע ד"ר עדו דגן מאוניברסיטת בר-אילן ושזכתה לתשומת לב רבה בשנים האחרונות.

דגן סיווג כל תת מטלה כדורשת הבנה מטפורית או ככזו שאינה זקוקה לכך. נמצא כי התוכנות שהגיעו להישגים הגבוהים ביותר באתגרים אלה, היו חלשות בהרבה בעבור אותן תת מטלות שהיתה מעורבת בהן מטפורה, אף על פי שייתכן כי רוב הקוראים האנושיים אפילו לא היו חשים בקיומה של מטפורה במטלות אלה (למשל "שוּק המניות התאושש"). ממצא זה מדגים את החולשה המשמעותית של הבינה המלאכותית בתחום זה, אפילו בהשוואה להישגיה (המוגבלים בינתיים) בתחומים אחרים של הבנת טקסט.
זיהוי מטפורות ככלי מחקר ספרותי

פרויקטים כמו ATT-Meta מראים את הפוטנציאל של ההבנה של מטפורה שהתפתחה בבלשנות ובחקר הספרות לתרומה להתקדמות בבינה המלאכותית. פרויקט "הנפש הוא מטפורה" מנסה לרתום את הבינה המלאכותית לחקר הספרות. את הפרויקט החל בראד פסנק (Pasanek, כיום פרופסור לספרות המאה ה-18 באוניברסיטת וירג'יניה) באוניברסיטת סטנפורד שבארה"ב. תוך כדי עבודת הדוקטורט שלו, הוא ניהל בכתב יד רשימה של מטפורות הקשורות לנפש ולחשיבה בתנ"ך ובכתבי מילטון ושייקספיר. כאשר גדלה הרשימה, גייס פסנק את עזרת חבריו מהפקולטה למדעי המחשב ביצירת מסד נתונים אלקטרוני שאליו הזין את ממצאיו.

אף על פי שהמעבר למאגר דיגיטלי הקל על האחסון, הבין פסנק כי כל עוד חיפוש וזיהוי המטפורות דורש עבודה אנושית, תהיה ההתקדמות מוגבלת.

איך אפשר ללמד מחשב לזהות מטפורה בעבודה ספרותית? היום חיפוש של הופעת מילה מסוימת הוא קל ופשוט. גם חיפוש של דימויים אינו קשה במיוחד – יש לחפש משפטים כמו "המחשבה היא כמו " ולאסוף את כל אותם ביטויים שיופיעו במקום (זוהי כמובן הפשטת-יתר, ויש צורך בשיטה כללית יותר, אבל הרעיון נשאר דומה). חיפוש של מטפורות קשה בגלל ההבדל בינן לבין דימויים: המטפורה אינה מציינת במפורש כי מתבצעת השוואה, ואינה מצביעה על המושגים שהיא משווה ביניהם.

פסנק סיפר על בעיה זו לחבר ילדות שלו כאשר נפגשו במקרה בחתונה. חבר זה, שהוא כיום מדען מחשב, הציע לו להשתמש בשיטות של למידה ממוחשבת: אם נספק למחשב דוגמאות של הצורות שבהן מופיעה מטפורה מסוימת, יוכל המחשב לזהות מאפיינים סטטיסטיים והסתברותיים של הטקסטים שסופקו כדוגמא ולחפש טקסטים נוספים המתאימים לאותה דוגמא. שיטה זו משמשת בין השאר לסינון של "דואר זבל" על-ידי לימוד ממוחשב של מכתבים שסווגו כדואר זבל ושימוש במידע שנלמד כדי לסווג מכתבים חדשים.

האם אריסטו טעה?

כיום מכיל מסד הנתונים כ-8,000 טקסטים המכילים מטפורות, שכ-6,000 מהם זוהו בעזרת חיפוש ממוחשב בשיטה זו ובשיטות ניתוח טקסט אוטומטיות אחרות. הטקסטים מסווגים לפי סוג המטפורה כמו גם לפי תאריך, מגדר ומקצוע המחבר/ת, הז'אנר של הטקסט ועוד. כך למשל אפשר למצוא כי דימויים מתחום הפיזיקה כמעט לא הופיעו לפני המאה ה-17 ונעשו נפוצים מאוד במאה ה-18, שבתחילתה דימה הפילוסוף בישוף ברקלי את הנפש לכדור בתנועה. דימויים מעולם המחשב, הופיעו כמובן רק לאחרונה ("אני צריך לעשות reset").

אין זו הדוגמא היחידה להשפעות טכנולוגיות על דימויי הנפש: לפני 300 שנה, כאשר החל להיווצר הרומן המודרני, הופיעו הדימויים של נייר וספרים, בעוד ההשוואה הראשונה למנוע שנמצאה במאגר נתונים זה מופיעה במחזה של שייקספיר מ-1594.

פסנק משתמש באפשרויות הרבות של סיווג וחיפוש שמעניק לו מאגר זה כדי לעקוב אחר השינויים במטפורות של הנפש לאורך ההיסטוריה של היצירות שאותן הוא חוקר. למשל, הנפש הצעירה הושוותה במאה הרביעית לפני הספירה ל"לוח חלק" (טאבולה ראסה). במאה ה-17 השתמש הפילוסוף לוק בדימוי דומה הלקוח מטכנולוגיית כתיבה אחרת – "נייר לבן, ללא כל אות כתובה". במאה ה-18 מופיעים דימויים של שיפוד מסתובב, כאילו הנפש מתבשלת באש הלמידה.

אריסטו כתב כי מטפורות הן החלק הנעלה של הכתיבה, בכך שבהן יוצר המחבר קישור בין דברים שאינם נראים כקשורים. פרופ' פסנק מצטט את טענתו של אריסטו כי שליטה במטפורות הן הדבר היחיד שהמשורר אינו יכול ללמוד מאחרים. בכוונתו להראות כי טענה זו אינה נכונה עבור זיהוי של מטפורות, ולהיעזר במחשב כדי ללמוד – תוך כדי כך שהמחשב מלמד את עצמו.

הכותב עובד בחברת ClickSoftware בפיתוח שיטות אופטימיזציה מתקדמות.

עוד בנושא באתר הידען

8 תגובות

  1. אני מומחה לתחום המטפורות ועסקתי שנים במחקר של קשרים בין שפה למוח בגישה פואטית קוגניטיבית. כיום אני כבר לא באקדמיה, ועובד בחינוך, אבל תחום הלשון הפיגורטיבית בוער בעצמותיי.

    יש בהחלט בהחלט דרך ללמד מחשבים להבין מטפורות בכלים של בינה מלאכותית, כלומר באמצעות חיקוי דרך הפעולה של המוח שלנו.
    אם מבינים מהם התהליכים הקוגניטיביים הנדרשים לצורך הבנה מטפורית, אפשר ליישם זאת גם על מחשב גם לצורך הבנה של מטפורות חדשות ומקוריות, ולא רק שליפה מהזיכרון של משמעות שהפכה שחוקה ומילונית.
    זה לא פשוט וזה בהחלט כרוך בהקניית יכולת למידה עצמית למחשב, אבל להערכתי זה אפשרי.
    אם יש כאן מישהו שמעוניין לקדם את הנושא, אתם מוזמנים לפנות ולחפש אותי.
    ד"ר מוטי בנארי
    קיבוץ קלי"ה

  2. כמעט כל המילים ורבדי השפה מקורם במטפורות.
    עם התפתחות השפה, מטפורות "מתות" ומתנתקות מהמשמעות המקורית, הדימויית והופכות למילים "רגילות" כלומר לכאלה המורות על משמעות ישירה ורגילה של הדבר ולא כמשמעות מטפורית.
    ממליץ על סיפרו של גיל דויטש על השפה (שכחתי את שם הספר).

  3. רק שלא ילמדו את הרובוט שלגעת בכוכבים זה להיות מפורסם
    באמת! שמעתי משהו משתמש במטאפורה הזו

  4. ישראל בנימיני הוא מן הכותבים הבולטים בגליליאו ואני תמיד קורא את כתבותיו בשקיקה.

    לדעתי, אחת הסיבות לכך שהבנת מטאפורות היא מן האתגרים הקשים של האינטליגנציה המלאכותית היא שמדובר במטלה לא פשוטה גם עבור האינטליגנציה האנושית.
    ראיתי הרבה דיונים באינטרנט על הביטוי "הצל המפכה" בשירו של מאיר ויזלטיר.
    בכל הדיונים הובעה תמיהה על משמעותו ואני תמיד תמהתי על התמיהה.
    בעיני מדובר פה באחת המטאפורות המוצלחות ביותר בשירה העברית.
    מי ששהה אי פעם בפרדס וראה את משחקי האור והצל על האדמה שתחת העצים וכמה משחקי אור וצל אלה דומים לריצודן של קרני השמש על מים מפכים לא יכול, לדעתי, שלא להתפעם מן הביטוי.
    אז מדוע בכל זאת הביעו אנשים תמיהה?
    אני מניח שחלק מהם פשוט לא הבין את המילה "מפכה".
    זה אתגר שניתן להתעלם ממנו בתוכנת מחשב שקל לצייד אותה בכל המילונים של כל השפות.
    אני מניח שחלק מהם מעולם לא בקרו בפרדס.
    גם בעיה זו אינה קשה במיוחד עבור תכנות בינה מלאכותית שבדרך כלל נוהגים לצייד אותם בידע האנושי של אנשים שכן ביקרו בפרדס (למי שלא הבין – זו הייתה מטאפורה).
    הבעיה הקשה באמת נובעת מכך שרוב האנשים – גם אם ראו מעיין מפכה, יודעים את פירוש המילה "מפכה", ביקרו בפרדס וראו את משחקי האור והצל על האדמה – אינם שמים לב לדמיון אפילו לאחר קריאת מילות השיר.

    לדעתי, אחת הדרכים החשובות שיש לנקוט בהן בחיפוש ממוכן של מטאפורות צריכה להתבסס על חיפוש פעלים בהקשר "לא נכון".
    בדוגמה הנ"ל, הפועל "מפכה" אינו אמור לחול על צל.
    כשמישהו "מתפוצץ מרוב כעס" מצביע הפועל "מתפוצץ" על קיומה של מטאפורה משום שבני אדם אינם מתפוצצים.
    כנ"ל כאשר מישהו "מרחף" או ש"רחפו עצמותיו".

    זו, כאמור, עצה למי שרוצה להתקרב באופן ממוכן לפתרון הבעיה אבל זה לא מהווה פתרון מלא להבנת מטאפורה בלתי מוכרת אלא רק לזיהויה. ההבנה הממשית, כאמור, קשה לא פעם גם לבני אדם.

כתיבת תגובה

האימייל לא יוצג באתר.

דילוג לתוכן