סיקור מקיף

ניצחון המכונה: “ווטסון” של יבמ הביס את אלופי האלופים ב- Jeopardy

חוקרים של יבמ בישראל, דוד כרמל ודפנה שיינפלד, השתתפו בפיתוח המערכת

מתמודדי התוכנית ג'פרדי ובהם ווטסון - מחשב על של יבמ
מתמודדי התוכנית ג'פרדי ובהם ווטסון - מחשב על של יבמ

בתום דו-קרב בן שלושה ימים, הביס מחשב-על של יבמ המכונה ווטסון את שני אלופי-האלופים במשחק הטלוויזיה האמריקאי Jeopardy.
המשחק הוכיח לא רק את יכולתו של מחשב לגבור על בני אדם בשעשעון טרויוויה – אלא גם את יכולתן של מכונות לענות לשאלות באופן דומה לזה שבו מתבטאים בני אדם: במשפטים שלמים, ובדיבור רהוט. ביבמ מסבירים כי ההישג הזה מניח תשתית לצורה חדשה של תקשורת בין אדם למחשב.
בסיכום החלק האחרון של התחרות, שנמשכה לאורך שלושה ערבים, צבר ווטסון 77,147 דולר עבור תשובות נכונות, לעומת 21,600 דולר של בראד ראטר ו- 24,000 של קן ג’נינגס.
ראטר וג’נינגס מחזיקים בשיא הזכיות במונחים של מספר משחקים ובשיא הזכיות הכספיות של בני אדם במשחק זה, שזוכה לפופולריות רבה בארה”ב .
הערב הראשון של ההקלטה, ביום שני השבוע, התאפיין במאבק שקול. מערכת ווטסון וראטר סיימו את הערב עם 5,000 דולר כל אחד, וג’נינגס עם 2,000. ביום שלישי, החל מחשב יבמ להפגין שרירים וליצור פער בצמרת: הוא סיים את הערב עם 35,734 דולר, לעומת 10,400 לראטר ו- 4,800 לג’נינגס.
בשלב האחרון,ביום רביעי, המשיכה המערכת של יבמ להרחיב את הפער, לא רק בזכות בסיס הידע העצום עליו היא נשענת, אלא גם בעזרת אלגוריתמים ייעודיים ששולבו בה, המאפשרים לה לבצע את ההימור הטוב ביותר על תשובות נכונות. כך, למשל, בשאלה הכפולה היומית – שאלה מיוחדת שלפני הצגתה רשאי המתחרה לקבוע בעצמו כל סכום הימור – החליט המחשב להמר על 2,127 דולר, תוך שהוא מעורר גלי צחוק של הקהל באולפן, הרגיל לצפות במתחרים הנוקבים במספרים עגולים יותר.
ראש מיזם הפיתוח של ווטסון, ד”ר דיוויד פרוצ’י, הסביר לאחר המשחק כי גם אם מספרים יצירי מחשב כאלה עשויים להיראות לבני אדם כעניין אקראי לחלוטין, הם מהווים תוצאה של שיקלול מורכב של מידת הביטחון של המחשב בקטגוריית השאלות המסויימת בה הוא מתמודד. במקביל, מעריך המחשב את מצבו במסגרת המשחק, עד כמה הוא מפגר אחר מתחרים אחרים או מקדים אותם, וכמה כסף ניתן עדיין להרוויח או להפסיד. בסופו של דבר, מתקבלים מספרים ברמת דיוק מירבית.
ווטסון פעל באופן חלק להפליא ברוב המקרים – אולם לא מבלי לטעות ולהיכשל פה ושם בשגיאות שעוררו צחוק בקהל. כך, למשל, כאשר נשאל לגבי שמו של נמל תעופה בניו יורק הקרוי על שם גיבור של מלחמת העולם השניה, השיב המחשב “טורונטו” – שמה של עיר בקנדה. במקרה אחר, התעקש המחשב להציע תשובה שגויה גם כאשר מתחרה אחר כבר הציע אותה, ולאחר שתשובתו לא התקבלה.
חוקרים מישראל
תהליך הפיתוח של ווטסון נמשך ארבע שנים, והתבצע כפרויקט משותף של שורת מעבדות מחקר של יבמ ברחבי העולם ובכלל זה מעבדת המחקר של יבמ בבחיפה.
החוקרים במעבדת המחקר של יבמ בחיפה התמקדו בהיבטים שונים של יכולות חיפוש מתקדמות, הרחבת מסגרת של שאילתות ממוחשבות, והגדרת הקשרים אסוציאטיביים המשרתים את יכולתה של ווטסון לדלג בין תכנים ומונחים שונים, על מנת להבין את ההקשר בו הם מוצגים.

דוד כרמל ודפנה שינוולד, חוקרים במעבדת המחקר של יבמ בחיפה
דוד כרמל ודפנה שינוולד, חוקרים במעבדת המחקר של יבמ בחיפה

, שהיו שותפים למאמץ הפיתוח הבינלאומי של ווטסון במעבדות יבמ סביב העולם,
והמובילים את הפרויקט בארץ ציינו כי ” Jeopardyמהווה אתגר גדול. התחרות מציגה צורך בידע בהיקף נרחב, כאשר כל אחד מהרמזים עשוי לכלול ידע רלוונטנטי או בלתי רלוונטי למושא החיפוש הסופי.
בני אדם מסוגלים להבחין כהרף עין בין מה שרלוונטי לעניינם ובין מה שאינו רלוונטי – אולם מחשבים אינם יכולים לדעת זאת. הם חייבים לשקול את כל הנתונים באופן מקבילי, כדי להגיע להבנה”.
הטכנולוגיה שהובילה לניצחון
מחשב העל ווטסון של יבמ משלב 2,880 ליבות מעבדים מסוג IBM POWER 7, ו- 15 טרא-בייט של זיכרון השקולים לתוכן של כמיליון ספרים מודפסים, העומדים לשירותו של יישום תוכנה מיוחד המאפשר בין השאר למחשב לתקשר עם הסביבה בשפה טבעית לחלוטין. ווטסון מבין את השאלה המוצגת לו בדיבור, מנתח אותה, מוצר את התשובה – ומשמיע אותה בקול מסותנז. המחשב הזה, הממשיך את השושלת של “כחול עמוק” שניצח את אלוף העולם בשחמט גארי קספרוב בשנת 1997, הוא הרבה יותר מהפגנת שרירים טכנולוגית במשחק טלוויזיה. את עוצמת המחשוב הזאת ניתן לרתום לחיזוי אקלים ומזג אוויר, למחקר רפואי, או ליישומים אחרים.
ביבמ מסבירים כי תכנון המחשב והמבנה הייחודי שלו מבשרים עידן חדש בתחום טכנולוגיות המידע – שבו מסוגלות מכונות ללמוד, להבין, לנתח ולהגיב מול כמויות גדולות של נתונים בזמן אמת. יכולות מחשוב אנליטי, דוגמת אלה של ווטסון, צפויות לחולל שינויים בעולם העסקים בפרט ובחברה בכלל.
ווטסון אינו מקבל החלטות, ואינו מחליף בני אדם. הוא מסייע להם, ופועל על פי הנחיותיהם. הוא מעבד כמויות גדולות של נתונים ומציג את המידע הנדרש לקבלת החלטות כמו גם המלצות לגבי ההחלטות האלה. פריצת הדרך הטכנולוגית בתחום הממשק בין המחשב ובין בני האדם הסובבים אותו, ויכלותו לתקשר בשפה מדוברת, מאפשרים לקדם את השימוש במחשבים בתחומים חדשים ורחבים מאי-פעם. כך, למשל, יוכל מחשב כזה לסייע לרופא לקבל את המידע הנדרש לצורך אבחנה, לסייע לאזרחים הנזקקים למידע אודות שירותי הממשלה לקבל אותו באופן נוח וקל, ולספק מידע לתיירים המבקרים באתרים שונים.
האתגר שבו עמד ווטסון במסגרת שעשועון הטלוויזיה הוא כפול, וגדול משמעותית מזה שמולו התייצב “כחול עמוק”, שנבנה לצורך משחק שחמט, המתנהל במסגרת כללים מוגדרים ובעולם תוכן בודד. ווטסון הצליח להתמודד במשחק המקיף אינסוף תחומי תוכן, ולהיות מסוגל להתמודד עם רמזים מסוגים שונים. מעבר לכך, הוא הצליח פעם אחר פעם להבין את המשמעות של שאלות המוצגות בשפה מדוברת, ולהכיר מושגים העשויים להירמז מתוך השאלות האלה באופן אסוציאטיבי.
את עוצמת החישוב הנדרשת לצרכים האלה, מספקת תצורת אשכול הכוללת עשרה שרתי IBM Power, כל אחד מהם במימדים של מקרר גדול, עליהם פועל אלגוריתם מורכב לניתוח שפה – ובסיס נתונים גדול במיוחד.
בדרך אל כל תשובה, ביצע המחשב חמישה שלבים מרכזיים. ראשית – ניתוח השאלה: ווטסון מפרק את השאלה ובוחן את הקשר בין המילים המרכיבות אותן. לאחר מכן, הוא מריץ חיפוש בבסיס הנתונים: על פי חוקי המשחק, המחשב המתחרה אינו קשור אל האינטרנט, על מנת שלא לתת לו יתרון על השחקנים בני האנוש. החיפוש מתבצע על גבי מאגר עצום של נתונים ומסמכים שנאספו בעוד מועד מהאינטרנט, האגורים במערך הדיסקים המשרת את ווטסון – ובונה תת-מאגר של מקורות פוטנציאליים לתשובה. מספר תשובות אפשריות מוגדרות על ידי אלגוריתמים שונים הסורקים את המסמכים שאותרו בשלב הקודם. התשובות האפשריות מוערכות זו מול זו בעזרת אלגוריתמים הבוחנים שמות אנשים, שמות מקומות והקשרים גיאוגרפיים, תאריכים, וכן הלאה. סיכום התשובה וההחלטה הסופית מתרחשים פחות משלוש שניות לאחר סיום השלמת השאלה – אחרת אין למחשב כל סיכוי לנצח את האנשים הניצבים מולו.
צוות המדענים של יבמ העומד מאחורי פיתוחו של ווטסון, התמודד עם אתגר מחקרי שלא זכה עד עתה למענה מלא: בניית מערכת ממוחשבת שתוכל להתמודד עם היכולת האנושית לענות על שאלות המוצגות בפניה בשפה מדוברת רגילה – במהירות, בדיוק וברמת ביטחון המקבילות לאלה של בני אנוש. פורמט המשחק של Jeopardy מציג את האתגר האולטימטיבי בתחום הזה: הרמזים אותם מקבל המתמודד בדרך להצגת התשובה מחייבים ניתוח של משמעות חבויה בטקסט, אירוניה, חידות מילוליות ומבנים מורכבים אחרים שעימם יודע המוח האנושי להתמודד – בעוד מערכות מחשב מסורתיות אינן ערוכות לטפל בסוג התכנים והשאלות האלה.
חוקי המשחק של Jeopardy, דורשים מהשחקנים לנסח את תשובותיהם במתכונת של שאלות – ולא כתשובה ישירה. כך, למשל, לשאלה דוגמת “הוא עומד בראש הממשלה בעלת מספר השרים הגדול ביותר בתולדות מדינתו, לאחר שכיהן בעבר כשגריר ארצו באו”ם, כשר אוצר, כראש ממשלה – והפסיד בבחירות קודמות” במקום התשובה הרגילה שתהיה “בנימין נתניהו” – צריך המתמודד להשיב: “מי הוא בנימין נתניהו”, ולהקדים את יריביו למשחק בכל סיבוב.
ווטסון, הפועל, כאמור, על גבי שרת מבוסס מעבדי POWER7 של יבמ, מהווה פריצת דרך מחקרית בתחום המענה המדובר הממוחשב לשאלות בשפה מדוברת. השרת, המשלב מספר גדול של מעבדים בעיבוד מקבילי, מותאם במיוחד לטיפול במספר גדול של משימות אותן יש לבצע במהירות על מנת לנתח את המשפטים המורכבים בהן מנוסחים הרמזים בתוכנית – ולהשיב במתכונת הנדרשת על פי חורי המשחק. המערכת משלבת שורת טכנולוגיות ייחודיות לטיפול במשימות בו-זמניות ובניתוח נתונים בזמן אמת.
.
מטרות רציניות הרבה יותר
למרות שהדיווחים העתונאיים צפויים להתמקד בנצחון המכונה על האדם ב- Jeopardy, יבמ פיתחה את Watson למטרות רציניות הרבה יותר. בחברה אומרים כי ההשתתפות במשחק היא חלק מתהליך פיתוח יכולות חדשות של מחשבים שידעו לנתח מידע מורכב, לבצע ישומים אנליטים מסובכים בתחום הרפואה – למשל ולתקשר ישירות בשפה טבעית, מדוברת. בסופו של דבר, חוזים ביבמ כי אפשר יהיה להפעיל יישומים ממוחשבים המתקשרים עם הסביבה בשפה טבעית ולא בשורות קוד או בשדות מוגדרים, ולנתח באמצעותם כמויות גדולות של מידע בלתי-מובנה.

12 תגובות

  1. תבחר דוגמה אחרת, עם שמעון פרס למשל
    אגב באחת הגרסאות של התוכנית באירופה, שאלו מי הלך לסרט ‘לשבור את הגלים’ עם 11 מאבטחים וגם שם התשובה היתה מיהו בנימין נתניהו..

  2. אינני מסכים עם יניב:

    “שימו לב איזה כוח מחשוב עצום נדרש כדי לנצח אדם בתחרות…”

    ולמוֹח שלנו אין כוח מחשוב עצום? וודאי שיש, רק שהכל נכנס לנפח מצומצם, לתוך הגולגולת משום שהמוח שלנו מורכב מחלקיקים בגודל מולקולרי, האלקטרוניקה של היום עדיין לא הגיעה לרמת מזעור כזו (אבל היא בדרך לשם) ולכן המחשב תופס נפח גדול יותר, זה עדיין לא מוריד מרמת ההישג המדהים.

    פעם חשבו שמחשב לעולם לא יצליח לזהות אובייקטים בתמונה, טעות – היום ישנם מחשבים שמזהים בצורה פנטסטית אובייקטים בתמונה, ואפילו מבדילים בין תמונה של כלב וחתול, משימה שתמיד צחקו שמחשב לעולם לא יצליח בה. כמעט כל המצלמות החדשות היום כוללות אפשרות של זיהוי פנים אוטומטי כולל זיהוי של אנשים ספציפיים.

    לגבי שאלתה של סאני, אני חושב שהתשובה חיובית וזה יקרה כבר בעשורים הקרובים מאד:

    http://www.youtube.com/watch?v=L0AR1cUlhTk

    http://www.tapuz.co.il/blog/ViewEntry.asp?EntryId=1065939&r=1

    העתיד כבר כמעט כאן.

  3. מסכימה עם יניב. למרות שאירוע זה הוא בעצם פריצת דרך טכנולוגית, בעיניי הוא מסמל דווקא את הפלא האדיר שהוא האדם ובעיקר המוח האנושי. במקום מצומצם בהרבה ועם תפקידים רבים יותר מצליח המוח להתמודד (גם אם לא לנצח) מחשב שלו הידע של כל מה שאי-פעם נכתב ונעשה. מעניין אם אי פעם נגיע לרמה שבה נוכל ליצור יצור הדומה באמת לאדם גם מבחינת הגודל (וגם קצת מפחיד…)

  4. בעיניי זה חדשות נפלאות, אני רואה בטכנולוגיה הזאת את נהגי החלל העתידיים!!
    ואולי ובעצם למה לא, גם המחליפים לטייסים בכדור הארץ, יותר ויותר מערכות יוכלו להיות מועברים לידי מערכות מחשבים שישחררו את האדם מהצורך לקום בבוקר ולהיות מחוייב למשהו טריוויאלי שאינו דורש חשיבה יצירתית לפיתוח או עשייה אמנותית !
    בנוסף לזה, לדעתי הטכנולוגיה הזאת אם תוכנס לשימוש במגוון תחומים תהפוך את האדם לטוב יותר כי לטכנולוגיה אין צורך לעשן, ולא תטריד מינית ולא תהיה מושחתת ..ולכן באם בני אדם יפגשו פחות שחיתות בחייהם הם יגדלו להיות אנשים טובים יותר! זה משנה את כל תפיסתי..אבל למי אכפת? העיקר המטרה !
    אגב..בקטנה עוד יכול להיות שמהמערכות האלה ניתן יהיה ליצור רובוט משפץ ולהתפטר מהצורך לפגוש שיפוצניקים !! חחחחחחחח זה יהיה גדול !

  5. בסופו של דבר מדובר יותר בהוכחה ליכולות של המוח האנושי לעומת עוצמתו של מחשב העל ווטסון, שימו לב איזה כוח מחשוב עצום נדרש כדי לנצח אדם בתחרות על ידע כללי בלבד, תארו לעצמכם, מחשב כזה שצריך לבצע תהליך של זיהוי פנים למשל שהמוח האנושי עושה אותו באופן אינטואיטיבי בחלקיק שניה ובדיוק שמתקרב ל100% או זיהוי שמע בסביבה רועשת או יכולת לנהל שיחה ולהבין משמעויות חברתיות מורכבות, אין בכלל ספק שמחשב העל האמיתי נמצא בתוך גולגלתם של המתמודדים ולא במקררי אי בי אם.

  6. גם הרכבת הראשונה הפחידה אנשים, בוני. לא נורא – תתרגל גם לזה. אני מבטיח.

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.