ידענים: תבונה מלאכותית

מאת 12 ביולי 2008 8 תגובות

האם ומתי נצליח לבנות מכשיר אוטומטי לתרגום משפה לשפה בזמן אמת, ומה יהיו ההשפעות של מכשיר שכזה שזמין לכל אדם בכל מקום ובאופן מיידי? מהם הקשיים שנאלץ לפתור לפני שנצליח לייצר מתרגם מוצלח שכזה? על כל זאת ועוד, במאמר שלפניכם

דג בבל

דג בבל

אתחיל במקרה שקרה לי לאחרונה: ישבתי בסלון עם אישתי והסבא שלה. הסבא דובר רק ספרדית, ומכיוון שכל מה שאני יודע להגיד בספרדית מסתכם פחות או יותר ב-"מוּי כיף", התקשורת בינינו דורשת תרגום סימולטני על ידי אדם שלישי. לפתע עלה במוחי רעיון. פתחתי את המחשב הנייד עם האינטרנט האלחוטי ונכנסתי לאתר התרגום של גוגל. כתבתי משפטים פשוטים באנגלית, ובן רגע קיבלתי תרגום בספרדית, מה שהקל מאוד על התקשורת בינינו. אז נכון שקשה לנהל כך שיחה מעמיקה וקולחת, אבל זה בהחלט מאפשר תקשורת בסיסית. כיצד יראה הדור הבא של הטכנולוגיה המעניינת הזו?

המונח "דג בבל" (Babel Fish) לקוח מספרו המופלא של דאגלס אדאמס (זצ"ל) – "מדריך הטרמפיסט לגלקסייה". בספר מוזכר בין היתר דג זעיר מכוכב אחר אותו משחילים לתוך האוזן, ומכיוון שהוא ניזון מגלי מוח, הוא יוצר תרגום אוטומטי בין כל השפות ביקום, ועל כן שמו "דג בבל".

ובכן כנראה שלא נאלץ להמתין למציאת דגים חייזרים שמעכלים גלי מוח. ייתכן מאוד כי בקרוב תוכלו למצוא מתרגם שפות אוטומטי שכזה בטלפון הסלולי שלכם. דמיינו מכשיר (דיגיטלי מן הסתם) שיוכל לתרגם שיחה בשפה א` לשפה ב` בזמן אמת. כוונתי היא למצב בו אני מדבר עברית ליד הטלפון הסלולרי שלי, (או כל מכשיר קטן אחר בעל מיקרופון), ומיד מושמעים הדברים באנגלית או צרפתית, או לחילופין מופיע טקסט על מסך ובו המילים שאמרתי בשפה אחרת.

אגיע מיד לשורה התחתונה – מכשיר תרגום אוטומטי שכזה ברמה גבוהה עדיין אינו נראה באופק. למרות התקדמות אדירה בתחום זיהוי שפה באמצעים דיגיטליים שנעשתה בעשרות השנים האחרונות, אנו עדיין רחוקים מאוד מיכולת להבנת שיחה. למעשה גם אם נצליח לנתח את השיחה ברמה גבוהה (לזהות את כל המילים הנאמרות בדיוק של 90% ומעלה), הרי שאנו עוד יותר רחוקים מהיכולת לתרגם כל מילה באופן מדויק בהתאם להקשר השיחה. החדשות הרעות יותר הן שללא פריצת דרך משמעותית ומהפכנית בתחום המחשוב, קיימים מכשולים רבים בדרך שיהיה כמעט בלתי אפשרי להתגבר עליהם. מי שרוצה להבין יותר לעומק מדוע אנו עדיין רחוקים מיכולת ניתוח שפה, מוזמן לקרוא את המאמר שכתבתי בנושא ונקרא "האם ניתן ליצור אינטליגנציה מלאכותית אמיתית".

פרופ` דוד הראל, דיקן הפקולטה למתמטיקה ומדעי המחשב במכון ויצמן, וחתן פרס ישראל לשנת 2004, הקדיש את הפרק האחרון בספרו "המחשב אינו כל יכול" לבעיית הבנת השפה – Natural language processing או בקיצור NLP. הוא מביא כמה דוגמאות משעשעות שממחישות את הקושי בהבנת מילים: "את המשפט: אני לא יודע איך לומר לך", ניתן בקלות להבין בטעות כאילו נאמר: "אני לא יודע איך לא מר לך." באופן דומה, המשפט: "אני שונא שירה", יכול להישמע כמו: "אני שונא שיר רע" (ע"מ 253).

את הבעייתיות הרבה הכרוכה בהבנת הדקויות והמבנה הסמנטי של שפה מדוברת הוא מדגים באמצעות הדוגמה המפורסמת שהיא ספק אמיתית וספק אגדה אורבאנית לפיה בימי המלחמה הקרה, משרד ההגנה האמריקאי רצה לפתח מתרגם ממוחשב שיוכל לתרגם מרוסית לאנגלית וההיפך. אחרי זמן ארוך בו פיתחו המדענים מערכת שכזו, הגיע קצין בכיר כדי לבחון את תוצאות עבודתם. הוא הזין למערכת את המשפט: "The spirit is willing but the flesh is weak", וביקש מהמחשב לתרגם את המשפט לרוסית ואת התוצאה לתרגם חזרה לאנגלית. התוצאה הייתה: "The vodka is strong but the meat is rotten". פרופ` הראל מסכם את הבעייה וכותב: "איננו אומרים שזה [הבנת השפה הטבעית] בלתי אפשרי או חסר תקווה, אלא רק שזה הרבה הרבה יותר קשה ממה שנדמה, וכרוך בהרבה הרבה יותר מכפי שנראה לעין" (ע"מ 256).

ולמרות כל זאת ברמה בסיסית הטכנולוגיה כבר קיימת ותוכלו למצוא לפחות מכשיר מסחרי אחד המתיימר לבצע תרגום סימולטני של מילים מאנגלית לגרמנית, צרפתית או ספרדית ואף להגות את התרגום בקול. מכשיר זה נקרא "Universal Translator". מעולם לא ניסיתי את המכשיר, אך קשה לי להאמין שהוא מציע יכולת גבוהה במיוחד. באתר היצרן כתוב כי הם בחרו לתרגם אוצר מילים שמכיל כ- 3,000 ביטויים נפוצים המתאימים לתיירים. עם כמות מילים מצומצמת שכזו, גם אם הן מזוהות באחוזים גבוהים, ברור כי לא ניתן לקיים שיחות פילוסופיות מעמיקות. בנוסף למכשיר המדובר, קיימות תוכנות רבות בעולם לתרגום משפטים (ובעיקר מילים) שמסוגלות לתרגם באופן שיאפשר הבנה כללית של המסמך המתורגם. דוגמה שימושית וטובה לכך היא התרגומון של גוגל אותו כבר הזכרתי בתחילת המאמר או התרגומון של Alta Vista והתרגומון המצויין של AJAX בהם אני משתמש מידי פעם לתרגום מגרמנית, צרפתית וסינית לאנגלית. אל תטעו – התרגום עדיין ברמה נמוכה מאוד ורחוק מיכולת לתרגום משפטים מורכבים, אבל ברמת מילה בודדת או משפטים פשוטים וקצרים, מספק תוצאות סבירות, אך כרגע תוכנות אלו דורשות חיבור לאינטרנט או לפחות שימוש במחשב של ממש.

אם וכאשר תהיה בידנו טכנולוגיה שכזו, למה היא תשמש? נראה כי אחד השימושים היעילים והנפוצים ביותר למכשיר שכזה יהיה בידי תיירים. דמיינו תייר שמגיע לארץ אחרת ולא צריך לשבור את השיניים על חמשת המילים שלמד בשפה המקומית. אלא שקיימת בכך סכנה של תרגום לקוי שאפילו לא תוכלו לזהות מיידית משום שלא תבינו את השפה. זה טוב כשמדובר בתייר ישראלי שמגיע לארה"ב ושואל עובר אורח "מה השעה?", והמכשיר יאמר משהו כמו: "?What is the hour", אבל מה יקרה אם תייר אמריקאי יאמר למכשיר: "?Where can I buy icecream" שעלול להיות מתורגם לעובר אורח ישראלי כ: "איפה יכול אני לקנות אני צורח?"

עם פיתוחים נוספים והתקדמות הטכנולוגית הצפויה, ניתן להניח כי נראה בעשור הקרוב נסיונות מסחריים יעילים יותר בטכנולוגיה שכזו, ואני מאמין כי בעשרים השנה הקרובות נוכל למצוא כמעט בכל טלפון סלולרי (שיהיה למעשה מחשב אישי נייד), מכשיר שיעבוד בצורה שתאפשר תקשורת בסיסית אך יעילה ובטוחה בין שני דוברי שפות שונות. מכשיר שכזה יוכל לשמש למטרות צבאיות במצבים בהם חיילים צריכים לתקשר עם אוכלוסיה הדוברת שפה זרה, עובדים בשדה תעופה בינלאומי, בשגרירויות ובמקומות אחרים בהם דוברים כמה שפות, וכמובן שימוש לצרכי תיירות ועסקים.

(מאמר זה לקוח מתוך הבלוג של אמנון כרמל שעוסק בעתידנות, טכנולוגיה, מדע ועוד)

8 תגובות ל “מתרגם שפות אוטומטי – "דג בבל"”

  1. דג ברשת

    למי שרואה הרבה סרטים מתורגמים ברור שהתרגום נעשה על ידי מחשב שאין לו מושג לא בשפת המקור לא בעברית ולא בהבנת ההקשר.

  2. jinji

    אז פשוט שיציגו על מסך את איות המשפט שהמכשיר קלט וכך המשוחח או (ה"תייר") יזהה מייד אם דבריו לא הובנו כשורה

    [או שיתרגמו לשפת היעד ומשם חזרה לשפת המקור ואז יבקשו אישור או עריכה]

    אמנם זה לא יהיה ממש זמן אמת אבל דיי קרוב
    וללא קפיצות טכנוגולוגיות רבות שאמנם יבואו אך לא בעתיד המיידי

    השאלה העיקרית היא עד כמה טכנולוגיית ה Speech 2 text מפותחת

    תועלת צדדית נוספת לטעמי ממכשירים אלו תהיה הצורך להטעים את ההברות כך שבני אדם ירגילו עצמם לחתוך את הדיבור בצורה ברורה
    (לדוגמא ההבדל בין שירה לשיר רע לעולם לא יפוספס כאשר תימניה תבטא אותו)

    אמנם אין צורך להדגיש עד כדי כך אך הדגשה מועטה ומוקפדת תקל מאוד על אלגוריתם הזיהוי אך גם על הסובבים דוברי אותה שפה ממש וכמובן שעל כבדי שמיעה או חרשים

  3. Eli Abir

    A truly thinking machine in its early form already exists. It rebuffed a number of points in the article. To the writer. You are invited to spend a few hours with the machine.
    Eli Abir

  4. תאמינו לי

    שהוודקה חזקה לא מרגישים שהבשר רקוב

  5. מיכאל

    אינני יודע אם זה כל כך קרוב אבל בכל זאת נרגיש שזה מגיע מהר כי זבובי הזמן מחבבים חץ ( Time flies like an arrow )

  6. רועי

    לא יהיה תרגום אמין עד שלא נצליח ליצור אינטיליגנציה מלאכותית אמיתית.

    אחרת כל מילון כזה יצטרך להתעדכן בהתאם לסלנג העכשווי, ובהתאם למקום.

    Leave me, in your mother…..

  7. רונן

    אפשר להזין לתוכנה רשימת מילים שניתן לפרש אותן בתור שתי מילים כמו "שירה" -שיר רע ו"לומר" -לא מר ואז המחשב יוכל לבחור את הפירוש הסמנטי היותר מתאים לשאר המשפט. לא לא בעיה להתמודד עם הבעיה הזאת ויפתרו את זה בתוך שנים בודדות לדעתי. והפירוש הסמנטי יכול להיות גם קל כי לכל מילה יש אסוציאציות והמחשב יכול לדעת לדוגמא שסביר להניח שהמילה מר היא לא מתאימה למשפט כי אין במשפט מילים שקשורות לטעמים למזון וכו'.

  8. אייל

    אני מאמין שנוכל להגיע למימוש אם נרתום קבוצה גדולה של משתמשים אשר יעזרו לתרגם ביטויים לשפות שונות.

    בדומה לסרגל הצד בויקיפדיה שמעביר בין שפות שונות, רק בתצורה של משפטים ומאמרים.

הוספת תגובה

  • (will not be published)