הרובוט שיקלע את סל הניצחון

הבעיות הכרוכות בלימוד רובוט לשחק כדורסל

אקונומיסט

לפעמים היד היא באמת יותר מהירה מהעין, דבר היכול לגרום לקשיים אם אתה רובוט. הרובוטים רואים את העולם מבעד למצלמות וידיאו. משמעות הדבר היא שהם תופשים אותו לא כזרימה חלקה ומתמשכת אלא כסדרה של תמונות בודדות – כשלושים בשנייה.
זה בכלל לא רע אם צריך לעקוב אחר תנועתם של עצמים הנעים באיטיות, אבל זה יכול להיות בעייתי ביותר כשדברים מתרחשים במהירות. כך למשל, כדור הנע במהירות של 10 קמ"ש יספיק לעבור תשעה ס"מ לפני שרובוט יראה תמונה עדכנית שלו. לכן, אם הרובוט ינסה לתפוס את הכדור, הוא ככל הנראה לא יצליח בכך.
הוא יודע איפה הכדור היה לפני רגע, אבל לא איפה הוא נמצא כעת. לא משנה באיזו מהירות יניע את איבר התפיסה ("היד") שלו למקום שבו אמור להיות הכדור, זה יהיה מאוחר מדי. הזמן, והכדור, כבר ינועו הלאה.
עד כה נהגו מהנדסים להתמודד עם הבעיה הזאת באמצעות שימוש במידע חזותי ובחוקי המכניקה כדי לצפות מראש את מסלולי תנועתם של עצמים. בדרך זו יכול הרובוט לחשב היכן עליו למקם את איבר התפיסה שלו, וזאת למרות היעדרה של הוכחה ישירה לכך שהכדור אכן נמצא שם. אבל פתרון כזה מניח כי אפשר לצפות את מסלולי התנועה של עצמים, דבר שאינו תמיד נכון.
במיוחד לא נכון הדבר במידה מספקת כאשר הרובוט נדרש לצפות את התנועה שלו עצמו.
בדומה לבני אדם, גם לרובוטים אין תמיד שליטה מוחלטת באיברים שלהם. אף שהם עשויים לדעת בדיוק לאיזה כיוון הם רוצים לנוע, לפעמים צירוף של נסיבות מקשה על השגת המטרה: גלגלי שיניים מחליקים, גלגלים נתקעים ועצמים שונים חוסמים את הדרך. היזון חוזר חזותי מסייע לבני האדם לבצע במהירות תנועות מדויקות (נסו להפגיש את האצבע המורה של יד ימין עם זו של יד שמאל מאחורי הראש). הקניה של יכולת כזאת גם למכונות אמורה לאפשר להן לעשות שימוש במהירות ובמיומנות הרבה שלהן.
דבר זה הפך כיום לאפשרי, הודות למחקר שבוצע על ידי מאסאטושי אישיקאווה, מהנדס אלקטרוניקה מאוניברסיטת טוקיו. זה יותר מעשר שנים שוקד ד"ר אישיקאווה על פיתוח "שבב-רשתית" דיגיטלי שיאתר תמונות ויעבד אותן, וכך יאיץ את יכולת המעקב החזותי של מכונות.
מכשיר זה מורכב ממספר גלאים, הממירים את גלי האור שנקלטים לזרם חשמלי. הגלאים מסודרים במערך סריגי (grid) על גבי השבב. כל אחד מהם מהווה את הגרעין של תא. בשאר התא יש "ממיר אנלוגי לדיגיטלי" (שקולט מהגלאי את אות הכניסה הרציף ומקודד אותו לשרשרת של ספרות 1 ו-0), וכן מספר קטן של שערים לוגיים (שאוספים מידע מהתא שלהם ומהסמוכים לו ומבצעים פעולות פשוטות של עיבוד תמונה).
התוצאה היא שבב, המבצע עיבוד ראשוני של מרבית המידע החזותי שנקלט – למשל על ידי הדגשת קווי המתאר המשמעותיים בתמונה – לפני שהוא מעביר את התמונה למעבד הראשי של הרובוט. הדבר מאיץ את משימת הפענוח של התמונה במידה רבה, משום שהעיבוד הראשוני של חלקי התמונה השונים מתבצע במקביל, ולא כפי שהיה מתבצע במעבד הראשי – חלק אחרי חלק. כתוצאה מכך, שבב-הרשתית מסוגל לעבד 1,000 תמונות בשנייה. בקצב עיבוד כזה, מכונית הנעה במהירות של 100 קמ"ש תעבור רק 2.8 ס"מ בין שני "מצמוצי עיניים", וכדור הנע במהירות של 10 קמ"ש – פחות מ-3 מ"מ. ברמה כזו של ודאות לגבי מיקום העצם הרובוט אינו זקוק ליכולת לצפות מראש את תנועות העולם הסובב אותו (או את זו של רגליו וידיו). הוא פשוט יכול לראות איפה כל עצם נמצא ולהושיט בכיוונו את איבר התפיסה שלו.
ההדגמות של הטכנולוגיה הזאת שכבר בוצעו היו מרשימות. באחת מהן המכשיר היה מסוגל לעקוב אחרי תנועת כדורסל המקפץ במהירות בלא כל איחור משמעותי (וזה יותר ממה שרוב בני האדם מסוגלים לעשות). בהדגמה אחרת, נעשה שימוש בשני שבבים כחלק ממערכת רובוטית גדולה יותר. הם סיפקו מידע למערכת לעקיבה חזותית, שנועדה לאפשר לרובוט "להסתכל" לאורך זמן על מטרה נעה, והזינו את התמונות שנקלטו למערכת חזותית מתוחכמת יותר ששלטה באיבר התפיסה של הרובוט. הודות למהירותו של שבב-הרשתית, יכול היה הרובוט להושיט את ידו לעבר עצמים שביצעו תנועה אקראית מהירה, ואף ללכוד אותם. לתשומת לבם של מגלי כשרונות במשחקי הכדור למיניהם.
אקונומיסט {הופיע בעיתון הארץ, 13/9/1999{

אתר הידען היה באותה תקופה חלק מפוטרל IOL מקבוצת הארץ

שיתוף ב print
שיתוף ב email
שיתוף ב whatsapp
שיתוף ב linkedin
שיתוף ב twitter
שיתוף ב facebook

כתיבת תגובה

האימייל לא יוצג באתר.

דילוג לתוכן