פרויקט התינוק הדיגיטלי

תינוקות לומדים במהירות להשליט סדר בעולם שסובב אותם; למעשה, יכולת התפיסה שלהם – כבר בגיל צעיר ביותר – עולה בהרבה על זו של מערכת אינטליגנטית ממוחשבת. השאלה, כיצד תינוקות יוצרים את תמונת העולם שלהם, מהווה אתגר לחוקרים בתחומי הפסיכולוגיה הקוגניטיבית ומדעי המחשב כאחד. התינוקות, מצד אחד, אינם יכולים להסביר לחוקרים כיצד הם לומדים להבין את סביבתם. מחשבים, מהצד האחר, למרות תיחכומם הרב, עדיין זקוקים לעזרה אנושית כדי לסווג ולזהות עצמים במטרה ללמוד אותם. מדענים רבים סבורים, כי כאן בדיוק קבור הכלב: כדי שמחשבים יוכלו "לראות" את העולם כפי שאנו רואים אותו, עליהם ללמוד לסווג ולזהות עצמים – בדומה מאוד לאופן שבו עושים זאת תינוקות.

פרופ' שמעון אולמן, ותלמידי המחקר דניאל הררי ונמרוד דורפמן, מהמחלקה למדעי המחשב ומתמטיקה שימושית במכון, יצאו לחקור את אסטרטגיות הלמידה של תינוקות, ויצרו מודל ממוחשב המבוסס על העקרונות שלפיהם תינוקות מסתכלים על העולם. המחקר שלהם התמקד בידיים. תינוקות לומדים תוך חודשים ספורים להבחין בין הידיים לבין עצמים אחרים או חלקי גוף אחרים למרות שהיד היא איבר מורכב ביותר: היא עשויה להופיע במיגוון גדלים וצורות, ולנוע באופנים שונים. צוות המדענים יצר אלגוריתם לזיהוי ידיים, במטרה לבחון האם המחשב יכול ללמוד לזהות כפות ידיים באופן עצמאי מתוך סרטי וידאו, גם כאשר הידיים מופיעות בצורות שונות, או נראות מזוויות שונות. האלגוריתם לא אמר למחשב באופן ישיר "זו היא יד", אלא נדרש לגלות, תוך כדי הצפייה בסרטים, מה הם המאפיינים של ידיים.

חיזוי כיוון המבט: תוצאות האלגוריתם (באדום), לעומת תוצאות של שני נבדקים (בירוק). תמונות הפנים (מלמעלה למטה) הן של פרופ' שמעון אולמן, דניאל הררי, ונמרוד דורפמן

האלגוריתם התבסס על מספר תובנות לגבי הגירויים שמושכים את תשומת ליבם של תינוקות. לדוגמה, תינוקות מסוגלים לעקוב אחרי תנועה מהרגע בו הם פוקחים את עיניהם, ותנועה זו עשויה "להצביע" על עצמים מסוימים שאותם כדאי להם לבחור מתוך הסביבה. המדענים שאלו, האם סוגים מסוימים של תנועה עשויים להיות בעלי משמעות רבה יותר לתינוקות לעומת סוגים אחרים, והאם סוגים אלה יכולים לספק את המידע הנחוץ ליצירת מושג חזותי. לדוגמה, יד יוצרת שינוי בשדה הראייה של התינוק, משום שבדרך כלל היא מזיזה חפצים. בסופו של דבר התינוק לומד להכליל, ולקשר בין האירוע של עצם המזיז עצם אחר לבין הופעתה של יד. המדענים כינו את הפעולה הזאת בשם "אירוע הזזה".

לאחר שתיכננו אלגוריתם הלומד לזהות אירועי הזזה, המדענים "הראו" למחשב סדרה של סרטונים. בחלקם נראו אירועי הזזה: ידיים שמשנות את מיקומם של עצמים שונים. סרטונים אחרים צולמו מנקודת מבטו של תינוק, המתבונן בתזוזת הידיים שלו-עצמו, וסרטונים נוספים הראו תנועות ידיים אחרות, שאינן מעורבות בהזזת עצמים, או תבניות כלליות כמו אנשים וחלקי גוף שונים. תוצאות הניסויים האלה הראו בבירור, שדי באירועי הזזה כדי ללמד את המחשב לזהות ידיים, וכי אמצעי זה יעיל הרבה יותר מכל השיטות האחרות – כולל צפייה בידיים של הצופה עצמו.

ן
בכך לא הושלם המודל. באמצעות אירועי ההזזה המחשב אמנם הצליח ללמוד לזהות ידיים, אולם הוא עדיין התקשה כשנתקל בתנוחות שונות שלהן. שוב חיפשו המדענים את הפתרון בעקרונות המנחים את תפיסתם של תינוקות: אלה יכולים לא רק לזהות את התנועה, אלא גם לעקוב אחריה. בנוסף, הם מקדישים תשומת לב רבה לפנים. כאשר הוסיפו לאלגוריתם מנגנון המאפשר לעקוב אחר הידיים שזוהו – וכך ללמוד את התנוחות האפשריות שלהן, וכן להשתמש בפנים ובגוף כבנקודת ייחוס למיקום ידיים, השתפר תהליך הלמידה במידה ניכרת.

בשלב הבא של המחקר התבוננו המדענים בעיקרון נוסף של למידת תינוקות, שמחשבים מתקשים לתפוס – לקבוע על מה מסתכל אדם אחר. המדענים התבססו על שתי התובנות בהן השתמשו קודם – שאירועי הזזה הם חיוניים, ושתינוקות מגלים עניין בפנים, והוסיפו תובנה שלישית: כאשר אנשים אוחזים עצם כלשהו בידיהם, הם מסתכלים בכיוון הידיים. בהתבסס על שלושת העקרונות האלה יצרו המדענים אלגוריתם נוסף, ובחנו את הרעיון שתינוקות לומדים לזהות את כיוון המבט באמצעות קישור בין פנים לבין אירועי הזזה. ואכן, המחשב הצליח ללמוד לעקוב אחרי כיוון המבט במידת הצלחה המשתווה לזו של אדם בוגר.

המדענים סבורים, כי המודלים שיצרו מראים, שתינוקות נולדים עם תוכניות "מחווטות" מראש במוחם, כמו העדפות לסוגים מסוימים של תנועה או של אותות ויזואליים. הם מתייחסים לתוכניות אלה כאל "מושג מוקדם", מעין אבני בניין מוכנות מראש, שבאמצעותן יכולים התינוקות להתחיל להרכיב ולהבין את תמונת העולם. כך, לדוגמה, "המושג המוקדם" הבסיסי של אירועי הזזה יכול להתפתח לכדי הבנת מושגים כמו ידיים או כיוון המבט, ובסופו של דבר להוביל לתפיסה של רעיונות מורכבים עוד יותר, כמו אנשים, עצמים, והיחסים ביניהם.

מחקר זה מהווה חלק ממאמץ מדעי נרחב יותר, המכונה "פרויקט התינוק הדיגיטלי". "הרעיון הוא ליצור מודלים ממוחשבים לתהליכים קוגניטיביים מוקדמים מאוד", אומר דניאל הררי. נמרוד דורפמן מוסיף: "מצד אחד, תיאוריות כאלה יכולות לשפוך אור על ההתפתחות הקוגניטיבית האנושית. מהצד השני, הן יקדמו את פיתוחן של טכנולוגיות חכמות כמו מחשבים רואים, מכונות לומדות, רובוטים וכדומה".

ארוע הזזה מתגלה בתא המסומן באדום: התנועה מגיעה אל תוך התא (שמאל), נשארת בו זמן קצר (מרכז), ועוזבת אותו (ימין), כשהיא משנה את מראהו. התנועה מוצגת בצבעים: צבעים חמים יותר מייצגים תנועה מהירה יותר

קטגוריות: בינה מלאכותית, המוח - מחקרים בסיסיים
תגיות: אלגוריתם, מדעי המחשב ומתמטיקה שימושית, מודל מתמטי, מכון ויצמן, שמעון אולמן, תפיסה

מכון ויצמן

מגזין חדשות מדע בשפה ידידותית של מכון ויצמן

לכל הכתבות של המחבר

תגובה אחת

משה הגיב:

15 ביולי 2013 בשעה 10:28

ולמה שנרצה בחיינו מכונות לומדות… מכונה זו מכונה לשם עבודה אם אתם נותנים להם אפשרות לחשוב ולחמוד זה מרחיק. אותן מהמובן של מכונה למשהו אחר. ולא בהכרח טוב.

כתיבת תגובה

אתר זו עושה שימוש ב-Akismet כדי לסנן תגובות זבל. פרטים נוספים אודות איך המידע מהתגובה שלך יעובד.