סיקור מקיף

בינה מלאכותית מאותגרת

לבן שיחנו האנושי קל מאוד לענות על שאלה כמו “איפה בית המרקחת?” אך בעבור הבינה המלאכותית היא קשה ביותר. אלמנטרי, ווטסון?

תקשורת אדם-מכונה. התמודדות עם שפה טבעית דורשת הבנה של משמעויות והכרת כמות גדולה של מידע על העולם האנושי
תקשורת אדם-מכונה. התמודדות עם שפה טבעית דורשת הבנה של משמעויות והכרת כמות גדולה של מידע על העולם האנושי

ישראל בנימיני | גלילאו

“מכל סוגי השירותים באינטרנט, זהו סוג השירות שבו אנו משתמשים בתכיפות הגדולה ביותר, למרות שאינו עונה לצורך האמיתי שעבורו אנו מפעילים אותו”. אם הייתם צריכים לנחש מה הייתה השאלה לתשובה זו, הייתם ודאי עונים “מהו מנוע חיפוש?”

זהו המענה הנכון, מכיוון שאף שאנו מפעילים מנוע חיפוש כדי למצוא מידע, השירות אינו עושה זאת בעבורנו: הוא מציג לנו תוצאות של חיפוש, ומותיר לנו את האתגר לבחור מתוכן את דפי האינטרנט שמתאימים לכוונתנו ולאתר בהם את הדפים שאנו זקוקים להם.

מכיוון שרובנו רגילים כל כך לתהליך זה, אנו שוכחים שלא היינו מסכימים לקבל סוג כזה של שירות מבני אדם. נסו לדמיין לקוח הפונה למוכר בחנות גדולה בבקשה למצוא נעל ריצה לילד בן 12, ומקבל בתשובה הפניה לכמה מחלקות − למחלקת בגדי ילדים, למחלקת מכשירי כושר, ולכל מחלקות הנעליים.

המצב בשטח גרוע יותר: חיפוש בגוגל של “נעל ריצה לילד בן 12” העלה את התוצאות הבאות: שאלה על כאב בזמן ריצה בפורום אורתופדיה כללית, דיון בפורום לספורט פנאי, ביקורת על תעשיית נעלי הריצה, והמלצות על תוכניות טלוויזיה. אכן, רובנו יודעים כי יש דרכים טובות יותר לבצע חיפוש כזה, אך מדוע עלינו ללמוד שיטות כאלה, במקום לצפות מהמחשב שייתן לנו תשובה מדויקת כפי שאנו דורשים מהמוכר בחנות?

לא לחפש, למצוא

בשנים האחרונות הופיעו כמה אתרי אינטרנט שכוונתם לענות של שאלות בצורה אמינה ורלוונטית. לרוב פיתוחים אלה מצליחים רק בעבור סוג מוגבל של שאלות. לדוגמה, כאשר האתר ask.com נשאל “מי כתב את 'התפסן בשדה השיפון'?” הוא מוצא מיד את התשובה.

לעומת זאת, כאשר הוא נשאל “מתי נכתב 'התפסן בשדה השיפון'?” הוא לא מוצא תשובה ומציג תוצאות רגילות של חיפוש, בהן המשפטים “'התפסן בשדה השיפון' הוא ספר משנת 1951″ ו”'התפסן בשדה השיפון' נכתב בשנות הארבעים”.

שני המשפטים נכונים – הראשון מתייחס לשנת הפרסום והשני לתקופת הכתיבה – אך הם מראים כי גם באתגר פשוט זה, יש להתמודד עם משמעויות שונות אפשריות של השאלה.

התמודדות עם שפה טבעית (להבדיל משפות מחשב) דורשת הבנה של משמעויות ועמידה באתגרים רבים – הכרת כמות גדולה של מידע על העולם האנושי, שיפוטים ערכיים, הבנת מטאפורות ומשחקי מילים ועוד.

ווטסון, בלי הולמס

הבעיות בהבנת שפה טבעית ידועות ולעתים נדרשת הגדרת מטרה שאפתנית עם מבחן הצלחה ברור כדי ליצור התקדמות משמעותית. חברת IBM עשתה זאת כאשר בנתה מחשב מיוחד ופיתחה עבורו תוכנה כדי להתמודד עם אלוף העולם בשחמט. בשאפתנות דומה, הכריזה לאחרונה IBM על כוונתה לפתח מערכת ממוחשבת שתוכל להתחרות מול שחקנים אנושיים מצטיינים במשחק “מלך הטריוויה”.

מכיוון שרובנו רגילים כל כך לתהליך החיפוש, אנו שוכחים שלא היינו מסכימים לקבל סוג כזה של שירות מבני אדם
הפרויקט נקרא “ווטסון”, על שם מייסד חברת IBM, תומס ווטסון. כדי למנוע מהמחשב יתרון לא הוגן הוא לא יהיה מחובר לאינטרנט בזמן התחרות. באופן זה המערכת נדרשת לאכסן בתוכה כמויות גדולות של המידע הזמין ברשת האינטרנט, ולארגן את המידע כך שיהיה זמין לניתוחים ולחיפושים מהירים.

לחם ושעשועים

IBM עדיין לא הכריזה על מועד הופעתה של ווטסון בתוכנית הטלוויזיה, אך מנהלי הפרויקט כבר החלו בתכנון האירוע עם מפיקי התוכנית. כדי ליצור עניין, שוקלים המתכננים לבחור מתחרים אנושיים מבין המנצחים הגדולים ביותר בעבר.

שאלות חשובות יותר בעבור ההצלחה בתחרות נוגעות לצורת התקשורת עם מנחה התוכנית. הוחלט כי השאלות יועברו לתוכנה בצורת טקסט: המתחרים האנושיים קולטים את השאלה בשמיעת המילים ובקריאתן על מסכי התוכנית. בעבור מתחרים אנושיים אלה “הישגים” מובנים מאליהם, אבל בעבור בינה מלאכותית הפיכת קלט חזותי וקוֹלי לטקסט היא עדיין דרישה גבוהה.

אך בסופו של דבר, השעשועים הבידוריים אמורים לשרת מטרות נוספות, ולתרום להתקדמות לקראת האפשרות למצוא תשובות במקום לחפש אותן.

דוגמה אחת לקושי של מענה על שאלות בעולם האמיתי היא השאלה “איפה יש X קרוב למקום שבו אני נמצא כרגע?” כאשר X הוא סיווג כלשהו, למשל בית מרקחת. אפשר להניח כי מיקומו של השואל ידוע, וכי בידינו רשימה של אתרים עם סיווגם ומקומם, ואכן, כמעט כל מכשיר ניווט יכול להציג תשובות לשאלות כאלה, אך כמו במקרה של מנועי חיפוש, גם כאן התרגלנו להמעיט בדרישותינו.

אם היינו שואלים עובר אורח, היינו מצפים לתשובות הרבה יותר מועילות. לדוגמה, התשובה האנושית תתחשב בזמן השאלה. אחרי חצות מדריך אנושי ינסה לכוון אותנו למקום שנראה לו שעדיין יהיה פתוח, מכיוון שהשתמש בהשערה כי השואל מעוניין לקנות משהו בבית המרקחת, וכי לשם כך על בית המרקחת להיות פתוח. המדריך האנושי יתחשב גם במצבו של השואל – למשל, האם הוא הולך רגל או נוסע ברכב, ויחליט בהתאם מה משמעות המילה “קרוב”.


סינון חכם

למרות המאמצים, קשה למצוא הצלחות משמעותיות כאשר נושאי החיפוש אינם מוגבלים לתחומים ספציפיים שהתוכנה הותאמה אליהם במיוחד. עם זאת, קיימות גישות אחרות שמציעות שיפורים ועזרה בסינון התוצאות.

אחת הגישות היא ניסיון לאגד את תוצאות החיפוש במקבצים העוסקים בנושאים שונים. כך למשל תכונת “גלגל הפלאים” (Wonder Wheel) של חברת גוגל מציגה בעבור חיפוש שמו האנגלי של “התפסן בשדה השיפון”, לצד תוצאות החיפוש הרגילות, את הנושאים: סלינג'ר, דמויות, עבודות להגשה, הסרט, ציטוטים, ועוד.

קיימים כלים רבים הנוקטים שיטות דומות או צורות אחרות של שיפור המהירות והדיוק של חיפוש באינטרנט, וכי קצב ההתקדמות בתחום זה גובר כתוצאה. אולי יום אחד נוכל לצפות ממחשבים למצוא תשובה לשאלותינו במקום לחפש אלפי דפים שבהם אולי מתחבאת התשובה.

ישראל בנימיני עובד בחברת ClickSoftware בפיתוח שיטות אופטימיזציה מתקדמות.

הכתבה המלאה פורסמה במגזין גלילאו, ספטמבר 2009

22 תגובות

  1. לא הורדתי את הקובץ מ MF אלא מגאוהאק בכל אופן לא ידעתי שדבר כזה יכול להמשך כ”כ הרבה זמן ,
    מזכיר כמובן את שריפת הנפט באלג’יר שלקח שנה לכבות נראה לי אבל הדבר היה מקומי (אם כי אינטנסיבי מאוד)

    ממליץ ללכת לגוגל ארט’ ולראות.

  2. עדיף מנוע חיפוש ישר מאשר איזה עוד גברת בטלפון יש לנו מספיק כאלה.
    מי שלא יודע לחפש שיתקין תוכנה שתשלים את המוגבלות שלו.

  3. ל-"למושון"

    מכיר את הפרויקט והוא באמת פרויקט מעניין.
    אבל כדי שזה באמת יתפקד כמו מוח של אדם חושב
    הוא צריך גם אמצעי קלט, לא?
    תחשוב שמרגע מסוים אני לוקח את המוח שלך
    ומנתק אותו מכל אמצעי קלט…(כולם כולל הגוף)

    חוץ מזה שאני לא בטוח שיש מספיק מידע ומספיק
    רזולוציה של המידע שכן קיים כדי לדייק את הסימולציה
    הזו לדרגה הנחוצה, ויש מצב די סביר שמוח הוא
    מערכת רגישה לתנאי התחלה, מה שיגרום לכך
    שכל הפרוייקט יהיה שווה ערך לניסיון לחזות את מזג
    האוויר בקליפורניה בעוד 5 שנים…

    נחכה ונראה

  4. מושון, יש פרוייקט אחד שזה בדיוק מה שמנסים לעשות בו, ליצור סימולצייה מלאה ופועלת של מוח אנושי שלם על גבי מחשב – “מלמטה למעלה”, לפרוייקט הזה יש לדעתי את מירב הסיכויים להגיע לבינה מלאכותית אמיתית בקרוב ולא רק “בכאילו” –

    1. ראיון עם עידן שגב נציגנו בפרוייקט המדהים הזה –
    http://www.youtube.com/watch?v=L0AR1cUlhTk

    2. שיחה נוספת עם עידן שגב –
    http://www.youtube.com/watch?v=Bz5IUaRr8No

    3. מתוך כלכליסט –
    http://www.calcalist.co.il/local/articles/0,7340,L-3359876,00.html

    4. מאמר מרתק על הפרוייקט, חלק א’ וחלק ב’ –

    http://seedmagazine.com/content/article/out_of_the_blue

    http://seedmagazine.com/content/article/out_of_the_blue/P2

    5. הרצאה מדהימה ומרתקת במיוחד של ראש הפרוייקט, מומלץ לצפות על גבי מסך מלא (לחיצה על כפתור ההגדלה תחת חלון הוידאו)

    http://ditwww.epfl.ch/cgi-perl/EPFLTV/home.pl?page=start_video&lang=2&connected=0&id=365&video_type=10&win_close=0

  5. בנוסף:

    קבוצת כל הקבוצות היא באמת קבוצה במובן שהיא מכילה קבוצות אחרות
    אבל היא אינה קבוצה במובן שניתן להפעיל עליה את הפעולות של תורת
    הקבוצות כי אין לה "רקע" = היא אינה מוכלת בשום קבוצה.

    יום טוב

  6. בהקשר של דתות-זה לא המקום, אני מאמין שכל דבר
    צריך להיות במקומו, ובמדע לא מערבים דתות!
    אבל כחובב מתמטיקה (כולל הצד הפילוסופי שלה)
    תורת הקבוצות נמצאת ביסוד המתמטיקה והיא
    כן כוללת מאגד-על שכזה והוא כידוע פרדוקסלי
    או אם תרצה אי-לוגי.

    ולכן ייתכן, באם יש קורולציה בין מתמטיקה ובין
    המציאות כי המציאות עצמה אינה כולה לוגית.

    ייתכן כמובן שזה לא רלוונטי בכלל ליקום הנ"ל
    ולמדע.

    יום טוב

  7. מושון כאו הכשל הלוגי האישי שלי – כי הבנתי האינסטנקטיבית תהיה להגיד שבדרך מסוימת זוהי קבוצה,ובדרכים אחרות לא , שוב כשל לוגי -עדיין נקודה (מצב מסוים) שבו יש קיום אחד ולא בהגדרה הראשונה שלנו לקיים-קיום , כנראה נראה לי כיתכן גם אם בלתי נראה להוכחה – לא קשור ולא ממש עוזר לדיון אבל רבות מהדתות והכתות נשענות על רעיון מאגד על – שמעל קיום הוויה זו או כל הוויה אחרת למעשה

  8. לאקוודור:
    אם מוסכם שבכל קבוצה מסוימת בלתי ניתן מתוך הקבוצה את הכל
    השאלה היא האם יכולה להיות נקודה שבה ניתן לראות את הכל…

    או אם תרצה (בתורת הקבוצות): האם קבוצת כל הקבוצות שמוגדרת
    כקבוצה שלא מוכלת בשום קבוצה היא בכלל קבוצה…

    יום טוב

  9. קודם כל – הערה לנוהל: צודק , מצטער לא שמתי לב לקפיצה

    תודה על התשובה המאירה , אז ניתן לי רק להבין מכך שגם אמת היא מושג יחסי לא סופי, כנגזרת ליצירת עצם הרעיון של אמת על ידנו , אין אמת אחת – משפט שתמיד נראה לי בעצם סותר את עצמו , נכון במהותו..?
    צוין שהרבה תלוי בנקודת ההסתכלות , כמו שציינתם, אך אמונתי היא שיש מימד שבו ניתן ל"ראות הכל"
    אבל אין שום תימוך לוגי לעניין כנראה , תודה בכל מקרה

  10. לכבוד "מאת למושון":

    ללא ספק אתה צודק לחלוטין!
    למרות זאת המערכות הריקות הללו התחילו מריקות גדולה יותר
    אם הבנתי נכון, רק מאלגוריטם של למידה ללא שום "בסיס נתונים"
    של מילים וזה נחמד בפני עצמו (שים לב שהדקדוק של השפה לא הוכנס
    מלאכותית אלא התפתח בדרך של ניסיון וטעייה).

    אישית אני בעד הגישה של מלמטה למעלה…
    הניסיון שלהם לתפיסתי הוא לא מספיק מלמטה…
    וחסרים בו דברים מהותיים.

    אני הייתי מתחיל עם אינטיליגנציה של בעל חיים…כלומר מגדיר
    באלגוריטם פרמטרים מסוימים שיהוו את המסנן של "טוב"/"רע"
    בדומה לאינסטינקטים שנוגעים ל-הישרדות ול-רבייה
    (אלגוריטם שייבחן התועלת של כל פעולה/דיבור/עשייה ביחס לאותם פרמטרים)
    וכמובן מנגנון למידה שנסמך על המסנן הזה שמייצר "רגשות" (אבחנות
    של טוב ורע ביחס לאותם פרמטרים).

    אינטיליגנציה מלאכותית גם לא תתפתח לדעתי ללא כמה סוגים מקבילים
    של "חושים"
    יום טוב

  11. אקוואדור:
    קודם כל – הערה לנוהל: לדעתי אין זה נכון להעביר את הדיון משרשור לשרשור. זה הופך את המעקב אחריו לקשה ביותר.
    הפיזיקה והמתמטיקה נוצרו במסגרת חיפושינו אחר דרכים להבנת העולם ולחיזוי ההתרחשויות שבו.
    הן מספקות את הסחורה בצורה כל כך טובה שפילוסופים רבים מצאו לנכון להעלות את השאלה "איך זה ייתכן שהעולם מציית כל כך טוב לחוקים שמתארות תיאוריות מתמטיות?" ואפילו הביאו אנשים מסוימים (כמו טגמרק http://en.wikipedia.org/wiki/Max_Tegmark ) להציע את ההצעה שאין בעולם דבר מלבד מתמטיקה.
    אינני יודע מה ציפו מייסדי המדעים למצוא. לדעתי זה כלל לא נכון (מבחינה היסטורית) שהם ציפו למצוא מערכת סופית של חוקים שמהם נובע הכל. הרעיון של "התיאוריה של הכל" הוא רעיון מן השנים האחרונות וגם לגביו אין בעצם כל דרישה לסופיות מערכת האקסיומות (ובוודאי שאין אפילו אכזבה אם כל האקסיומות שצריך להוסיף הן אקסיומות טכניות בסגנון "אוסף האקסיומות עד כה הוא קונסיסטנטי" שבעצם אינן אומרות שום דבר חדש ונחיצותן היא פורמלית בלבד).
    אבל אפילו אם היה זה נכון מבחינה היסטורית שמייסדי המתמטיקה והפיזיקה קיוו למצוא מערכת סופית של אקסיומות – מטרתם האמתית הייתה לגלות את האמת ואם האמת היא שאין כזו מערכת סופית אז זה מה שיש ועם זה ננצח.
    כל זה לא שייך לשאלה אם יש אלוהים פרט לכך שזה מבטיח לנו שתמיד יהיה לאלוהי הפערים מקום להתחבא בו – כלומר – תמיד יימצא משהו שיאפשר לחסידי האלוהים לומר משפט כמו "בסדר. אז ניסחתם חוקים 1,2,3,4,5,….57 אבל חוקים אלה אינם מאפשרים לכם להסיק אם X נכון או לא נכון ולכן ל X אחראי אלוהים שאותו כבר נישלתם מכל שאר התפקידים.

  12. מיכאל – ?אם כביכול הפיסיקה המתמתיקה ואלו נוצרו כדי לאשש תאוריות פילוסופיות של האדם והיקום ,
    ומתישהו מתוך התפתחות מדעים אלו הראה אדם שעם הלוגיקה הזו אין תשובה סופית – שלשם כך התחיל המסע -אני לא כל כך מבין מה זה אומר בעצם – האם מעבודתו של גדל יש להסיק ששום תאוריה אחת לא תכלול הכל ?ואם כך זהו מתווסף לגישות הפילוסופיות ש"אין אלוהים" או "אלוהים מת"??

  13. מערכות מהסוג שאתה מדבר עליהן עלובות ביותר וממש לא מייצגות בינה מלאכותית אמיתית, אפילו לא מתקרבות לכך, נסה בזמן שיחה עם תוכנה כזו לשאול אותה שאלות שמתייחסות לנושא שדיברת איתה עליו רק לפני מספר משפטים, ותראה איך היא מתחילה להתבלבל ולא יודעת מה לענות ואיך להתייחס לזה, אי אפשר לפתח עם התוכנה שיחה רצינית כי היא תמיד יודעת להתייחס רק למשפט או שניים האחרונים שכתבת לה ואין לה שום הבנה אמיתית לגבי נושא השיחה…. התוכנות האלו רחוקות שנות אור מ AI אמיתי, זו קליפה ריקה מתוכן.

  14. נקודה:
    מכיוון שלא נראה לי שבן האדם ישודרג בטווח הקרוב – יותר פרודוקטיבי להגדיר את הבעיה כבעיה בתוכנה.
    רק כך נצליח לשפר את התמודדותנו אתה.
    מבחינה אובייקטיבית – אי התאמה בין שתי מערכות (במקרה זה התוכנה והאדם) אינה בעיה של המערכת האחת או של השנייה אלא בעיה בצירוף שלהן.
    כמעט כל הבעיות הן כאלו ואנו מעדיפים בדרך כלל להגדיר את הבעיה במונחי הפתרון.
    כשמזון מסוים גורם לאדם הרעלת קיבה – אפשר גם לטעון שזו בעיה באדם ואפילו לאשש טענה זו על ידי העובדה שהחיידקים ניזונים מאותו מזון ללא כל בעיה. 
    ובכל זאת, הפתרון במקרה זה יהיה החלפת המזון ולכן נאמר שהמזון מקולקל.

  15. נראה לי שהבעיה היא לא במנועי החיפוש אלא בספציפיות של בני האדם צרי האופקים, יחסית לרוחב היריעה של תוצאות מנועי החיפוש.

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.