כדי לזהות כלב, למשל, המחשב צריך לתפוש את מהות הכלביות

מדוע קשה כל כך לפתח מערכות אוטומטיות לזיהוי עצמים
מאת אורי ניצן

בכל בנק ישנם עובדים שאחראים על פיענוח האותיות והמספרים
שרשומים על הצ'קים. פעולת המיון קלה אך גוזלת זמן רב, ובכל שנה
מוציאים הבנקים בארה"ב יותר משני מיליארד דולר בעבור שירותי
מיון מהסוג הזה.

מכונות שקוראות כתב יד היו יכולות לבצע את עבודת המיון בשביל
הבנקים, אך הטכנולוגיה הנדרשת לזיהוי כתב יד ברמת דיוק אנושית
עדיין לא קיימת. "כל ילד בן שבע מסוגל לקרוא את כתב ידו וכתבי
יד של אחרים", אומר פרופ' שמעון אולמן ממכון ויצמן, "ונשאלת
השאלה מדוע מחשבי העל המתקדמים ביותר לא מסוגלים לעשות זאת".

אולמן, מתמטיקאי בהכשרתו, חוקר כבר שנים רבות את מערכת הראייה,
ובמסגרת מעבדה לבינה מלאכותית הוא מתכנן ומפתח "מכונות רואות".
עבודת הדוקטורט, שכתב במכון הטכנולוגי של מסצ'וסטס (MIT), עסקה
בקשרים בין ראייה תלת-ממדית לתפישה של תנועה. לאחר מכן נשאר
ב-MIT כחבר סגל למשך15 שנה, עד שהצטרף למחלקה למתמטיקה ומדעי
המחשב במכון ויצמן, שכיום הוא עומד בראשה.

"המטרה שלנו", אומר אולמן, "היא לפענח את סך הפעילות של תאי
העצב המעורבים בראייה, ולהבין את הצד החישובי של המערכת.
העבודה מתבצעת תוך שיתוף פעולה עם מדעני המוח שחוקרים את הצד
הביולוגי ואת פעילותם החשמלית של תאי עצב בודדים, ואחד מיעדיה
המרכזיים הוא פיתוח מערכת ראייה מלאכותית שמזהה עצמים".

בן אדם מבדיל בקלות בין כלב לחתול, ובכל זאת, החוקרים מתקשים
לשחזר את היכולת הזאת. אלפי אנשים עבדו במשך עשרות שנים כדי
לפתור את הבעיה של זיהוי עצמים אוטומטי, ועדיין אין מערכת
שעושה זאת ברמה של ילד בן שלוש. מערכת ראייה מלאכותית חייבת
לקחת בחשבון את העובדה שתמונות של עצם מסוים יכולות להיות
שונות מאוד זו מזו. אם המוח היה שומר שתיים או שלוש תמונות של
העצם והיה משווה אותן לתמונה חדשה, קרוב לוודאי שכלל לא היינו
מזהים עצמים. זווית הראייה של העצם משתנה, ישנם משחקים של אור
וצל, וכשמתכננים את מערכות ההפעלה של "מכונות רואות" חייבים
להבין ולהתייחס לכל השינויים האפשריים. המוח האנושי מכיר את
מגוון הופעותיו של העצם, ו"מנטרל" את המכשולים ברמה הלא מודעת.

"בני אדם מסננים מידע לא רלוונטי, ומסוגלים לאתר את המאפיינים
שהופכים כלב לכלב וחתול לחתול. כולנו יודעים ממקור ראשון שהמוח
מסוגל לתפוס את מהות הכלביות", אומר אולמן, "ומהרגע שנתקלנו
בכלב נושך ניזהר מכל כלב שדומה לו, ומכל זווית ראייה".

פרופ' אולמן וחבריו מנסים לשחזר את היכולת הזאת במערכות
ממוחשבות, ובעקיפין גם להשליך וללמוד על תהליכי הראייה.
"השאיפה היא לפתח תוכנות מחשב שקולטות תמונה ומסוגלות לתאר את
העצמים שמופיעים בה ולהגדיר אותם. לשם כך מפתחים אלגוריתמים
מתמטיים ומנסים להבין את ההקבלות בין פעילות המוח לזו שמכתיב
האלגוריתם".

הגישה המקובלת לזיהוי עצמים מבוססת על השוואה של תמונת העצם
לתמונות רבות שנלמדו בעבר. על פי גישה זו זיהוי עצם כחתול או
ככלב ייעשה באופן הבא: מזינים את המחשב בתמונות רבות של כלבים
וחתולים, בדגש על סוגים שונים של חתולים וכלבים וצילומים
מזוויות שונות. המחשב משווה את תמונת העצם למאגר התמונות
הקיים, ודמיון מספיק לאחת הדוגמאות יזהה את העצם ככלב או חתול.
הגישה המקובלת אינה מתחשבת בעובדה שחיות המחמד יכולות להניף את
הזנב בנקודת זמן אחת ולשמוט אותו בנקודת זמן אחרת.
הדינמיות של מבנה העצם תקשה על המחשב להתאים אותו בהצלחה
לדוגמאות האגורות בזיכרון.

המחקר של אולמן מתבסס על איתור אוטומטי של מאפיינים חלקיים.
מאפיינים אלה הם תתי-צורות ומקטעים של העצם, המהווים מעין
אלף-בית בסיסי שממנו ניתן להרכיב עצמים שונים. האלגוריתם
שפיתחו אולמן ותלמידיו חותך את תמונת העצם ל"חתיכות פאזל"
וקובע את חשיבותה היחסית של כל "חתיכה" להגדרת הכלביות או
החתוליות. "כך אנחנו יכולים לחשב את כמות המידע הייחודי שניתן
להפיק מהזנב של הכלב או האוזן של החתול. המחשב אוגר בזיכרון את
האלף-בית הצורני שממנו בנויים כלבים וחתולים, וכשיידרש לזהות
כלב הוא ייעזר במאגר המאפיינים החלקיים המגדירים את הכלביות".

מערכת ניסיונית שפותחה על ידי תלמידי מחקר של אולמן כבר
"יודעת" להגדיר ולברור מתמונות את המאפיינים הבסיסיים של
מכוניות, פרצופים ועצמים אחרים. בשלב שני, המערכת מנצלת את
המאפיינים שהוגדרו על ידה כדי לאתר פרצופים ומכוניות בתוך מספר
רב של תמונות חדשות. "אפשר לערוך הקבלה בין המערכת שלנו לילד
הרואה בפעם הראשונה עצמים, מכוניות למשל. הילד מאתר ומאחסן
בזיכרון את המאפיינים הייחודיים למכונית", מסביר אולמן,
"ומאותו יום יהיה מסוגל לזהות גם מכוניות שלא ראה מעודו".

המחקר הישראלי בתחום הראייה הממוחשבת הוא מהמובילים בעולם, ויש
לו השלכות מעשיות רבות. פרופ' אולמן נמנה עם מקימי חברת
"אורבוטק", המיישמת מערכות ראייה ממוחשבת. החברה כבר מייצרת
ומשווקת מכשיר המבצע בדיקה ראייתית אוטומטית של מעגלים מודפסים
(הבדיקה התבצעה בעבר על ידי עובדים המצוידים בזכוכית מגדלת).
המעגלים המודפסים הם חלק מכל מערכת אלקטרונית, ותפקידם לקשר
בין השבבים – אבני הבניין של המערכת.
הבדיקה הראייתית האוטומטית הפכה לחלק בלתי נפרד מתהליך הייצור
של המעגלים, והיא כוללת "קריאה" של הקישורים האלקטרוניים
המודפסים וזיהוי של הטעויות והפגמים.

https://www.hayadan.org.il/BuildaGate4/general2/data_card.php?Cat=~~~309911385~~~207&SiteName=hayadan

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זו עושה שימוש ב-Akismet כדי לסנן תגובות זבל. פרטים נוספים אודות איך המידע מהתגובה שלך יעובד.