סיקור מקיף

לראות כמו הנולד

חלוץ הראייה הממוחשבת מנסה לחקות את מוח האדם – ראיון עם זוכה פרס ישראל פרופ’ שמעון אולמן

ראיה מלאכותית. איור: shutterstock
ראיה מלאכותית. איור: shutterstock

כולנו מוקפים מדי יום באלפי מחשבים ומצלמות. ואולם, מותר האדם מן המחשב, נכון לעכשיו, הוא היכולת שלנו להבין מה אנו רואים, בעוד המחשב זקוק למתווך. אדם המתבונן בפניהם של אנשים אחרים יוכל לזהות בקלות הבעות פנים כמו עצב, שמחה, כעס או דאגה. המחשב יכול לסרוק הרבה יותר פנים במהירות רבה, אבל לא יוכל לזהות את ההבעות בלי הרבה מאוד הדרכה מוקדמת, וגם אז יהיה מוגבל למגוון מסויים מאוד. האם אפשר להקנות למחשבים את יכולת פענוח התמונה שיש לבני אנוש? “בכמה תחומים מאוד קשים, המחשבים כבר אינם רחוקים מהיכולת האנושית, כמו למשל היכולת לזהות עצמים מסויימים בתמונה, או לזהות פרצופים”, אומר פרופ’ שמעון אולמן ממכון וייצמן למדע, שיקבל השנה את פרס ישראל במתמטיקה ומדעי המחשב על תרומתו לתחום הראייה הממוחשבת. “אנחנו מסתכלים על העולם ומקבלים מיד, תוך חלקיק שניה, אינפורמציה מאוד עשירה ומגוונת: אולי אנו רואים אנשים משחקים שח או ילדים משחקים בכדור או מכונית חוצה צומת. כל דבר שאנו מסתכלים, מייד ברור לנו מה נמצא שם: אם יש שם אנשים, מי עושה מה למי וכן הלאה. בינתיים אין לנו יכולת לעשות דברים כאלה במחשב. אבל אנו מתקדמים לקראת יכולות כאלה”.

כנפיים ומוח
אולמן היה טייס קרב בחיל האוויר, שפנה ללימודי מתמטיקה ופיזיקה, במהלכם גילה את חקר המוח וצירף גם ביולוגיה לתכנית לימודיו באוניברסיטה העברית. כשסיים בהצטיינות את התואר הראשון, פנה לדוקטורט ישיר בתחום הבינה המלאכותית במכון הטכנולוגי של מסצ’וסטס (MIT). הוא גם נשאר שם כחוקר, אבל בשנות ה-80 חזר לארץ, הצטרף למכון וייצמן, והביא לארץ את תחום הראייה הממוחשבת. “במערכת האנושית העיניים מביאות את התמונה למוח והמוח עושה את העבודה, מבין מה יש בתמונה”, הוא מסביר. “היינו רוצים לעשות את אותו דבר בצורה ממוחשבת, במערכת של מחשב ומצלמה. התמונה מגיעה למחשב, והוא ממלא את תפקיד המוח. היינו רוצים לדעת איזה מין חישובים צריך להכניס לו, אילו אלגוריתמים ואילו יכולות חישוב, כדי שיוכל לראות ולהבין את העולם סביבו מהתמונות המגיעות אליו דרך המצלמה”.

ללכוד את המהות
בעבודותיו המוקדמות הצליח אולמן להיות הראשון שפיתח מערכת מחשב היודעת לזהות עומק בתמונה דו מימדית, ופיתח מערכות לזיהוי תנועה. בהמשך עבר לפיתוח מערכות “גבוהות”, המיועדות להבחנה בין עצמים שונים. לדוגמה, כלב וחתול הם יצורים דומים למדי, יש להם ארבע רגליים, ראש, זנב וכו’. אדם, אפילו פעוט, יכול לזהות בקלות אם הוא רואה כלב או חתול, אבל למחשב קשה מאוד ללכוד את ה”כלבי” וה”חתולי”, והתכנה זקוקה לצפייה מודרכת באלפי תמונות, כדי להצליח להגיע לרמה סבירה של אבחנה. החוקרים ממשיכים להתמודד כל העת עם אתגרים כאלה. אחד המיזמים שאולמן מוביל כעת הוא “התינוק הדיגיטלי” – נסיון לפתח מערכת מחשב שתוכל לחקות את המתרחש במוח של תינוק, הקולט ומעבד שפע עצום של מידע חזותי בשנת חייו הראשונה, ומרכיב לעצמו תמונת עולם. “כשתינוק פוקח את העיניים הוא מתחיל לקבל דרכן עושר של אינפורמציה, ובאופן כלשהו זה מסתדר לו בראש והוא מתחיל להבין את העולם בלי הדרכה מסודרת מהאנשים שסביבו, משום שהוא עדיין לא מבין שפה”, אומר אולמן. “היינו רוצים להבין את התהליכים האלה ולהראות שאפשר ליצור אותם במכונה. מערכת מחשב שלא ראתה אף תמונה, ומתחילים להזרים לה שבועות וחודשים של תמונות סרטי וידאו. כתוצאה מזה היא תיצור לעצמה תמונת עולם: אנשים, עצמים, הקשרים ביניהם וכן הלאה”.

פרופ` שמעון אולמן, חתן פרס ישראל במתמטיקה ומדעי המחשב מתקרבים ליכולת האנושית בכמה תחומים. צילום: יח"צ
פרופ` שמעון אולמן, חתן פרס ישראל במתמטיקה ומדעי המחשב מתקרבים ליכולת האנושית בכמה תחומים. צילום: יח”צ

 

תשובות רחוקות
הדרך לפיתוח יכולות כאלה אצל מחשבים עדיין ארוכה, והיא כרוכה בהבנה טובה יותר של התהליכים המתרחשים במוח האדם. “אצל אדם, כל הלמידה, לפחות בשלבים הראשונים, נעשית בצורה מאוד לא מודרכת. הוא פשוט נחשף לאינפורמציה, ומסוגל לספוג מתוך העושר המידע את האינפורמציה המשמעותית”, הוא אומר. “יש שם דברים שהם שונים בצורה מהותית מכל מה שאנו מבינים כרגע. לכן הסוג הזה של כיוון מחקר נראה מעניין, אבל עוסק בשאלות שאנו עדיין רחוקים מאוד כיום מלמצוא להן את התשובות”.

תחום מתפתח
נוסף על עבודתו האקדמית, אולמן הוא אחד הכוחות המניעים את תעשיית הראייה הממוחשבת בישראל. הוא היה בין מייסדי חברת “אורבוטק”, העוסקת בסריקה ויזואלית של רכיבים לתעשיית האלקטרוניקה, על בסיס פטנטים שפיתחו הוא ועמיתיו. במשך יותר מ-20 שנה היה אולמן המדען הראשי של החברה, וכן שימש בתפקיד דומה בחטיבה הישראלית של חברת Applied Materials. לתחום הראייה הממוחשבת יש מגוון עצום של יישומים פוטנציאליים: משימושים בטחוניים, כמו חיפוש מחבלים בקהל בעזרת מערכות לזיהוי פנים, דרך יישומים רפואיים, פיתוחים בתחום המסחר, התעשייה, סיוע לעיוורים, פיתוח כלי רכב אוטונומיים ועוד. “זה תחום שמנבאים לו גדולות, והוא מתפתח בצעדים מהירים בעולם כולו, ולשמחתנו מתפתח בצעדים מהירים במיוחד כאן בישראל”, אומר אולמן. “תעשיית הראייה הממוחשבת בישראל כבר מייצאת במאות מיליוני דולרים בשנה ומעסיקה אלפי עובדים, והיא צפויה להמשיך ולהתרחב”.

נחכה ונראה
אולמן היה חלוץ הראייה הממוחשבת בארץ, והיום פועלות בעקבותיו מעבדות רבות בתחום – באקדמיה ובתעשייה. השאלה כיום אינה אם המחשב יוכל לחקות את תהליכי הראייה של המוח האנושי, אלא מתי זה יקרה, ואם היכולות האלה ישמשו למען האנושות או נגדה. נחכה ונראה… כלומר אנחנו נחכה, והמחשב – יראה.

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.