סיקור מקיף

רובוטים לומדים

אורי קרטון, סטודנט המסיים בימים אלו את התואר השלישי במחלקה להנדסת תעשייה וניהול באוניברסיטת בן-גוריון מפתח אלגוריתמי בינה מלאכותית המיושמים על רובוטים

איור 1. זרוע רובוטית הלומדת כיצד לרוקן שקית המכילה חומרי חבלה שאינם קונבנציונאליים (בתנאי מעבדה)

איור 1. זרוע רובוטית הלומדת כיצד לרוקן שקית המכילה חומרי חבלה שאינם קונבנציונאליים (בתנאי מעבדה)

במחלקה להנדסת תעשייה וניהול אשר באוניברסיטת בן-גוריון בנגב בהנחיית פרופ' הלמן שטרן ופרופ' יעל אידן מפתח אורי קרטון, סטודנט המסיים בימים אלו את התואר השלישי, אלגוריתמי בינה מלאכותית המיושמים על רובוטים. עיקר המחקר של אורי קרטון עוסק בשיפור אלגוריתמים מקבוצת ה – Reinforcement Learning (RL), תת תחום של בינה מלאכותית. ב – RL סוכן (לדוגמא, רובוט נייד) מתפקד בעולם או בסביבה מסוימת. תוך כדי ביצוע פעולות בסביבה הסוכן מקבל חיזוקים (Reinforcements) או עונשים (Punishments), אינדיקטורים המצביעים עד כמה התנהלותו משביעת רצון. על פי אינדיקטורים אלו הסוכן לומד כיצד להתנהל בסביבה, מאילו סיטואציות עדיף לו להימנע ואלו פעולות עדיפות לו לביצוע.

אורי קרטון פיתח אלגוריתם הנקרא  , אלגוריתם אשר יושם על שתי מערכות רובוטיות: (1) זרוע רובוטית אשר תפקידה לאחוז תיק החשוד כמכיל חומרי חבלה שאינם קונבנציונאליים (כגון: נגיפי סארס אנטראקס ואבולה) ולרוקנו מתוכנו על גבי משטח בדיקה (איור 1) ו – (2) רובוט נייד למטרות ניווט (איור 2). האלגוריתם המיושם על מערכת רובוטית מאפשר לה לבדוק אם רמת הלימוד שלה אינה מספקת או שנתקלה במצב בלתי פתיר. במידה ותרחיש זה מתקיים, המערכת פונה לאדם לקבלת עצות. האדם מציע פיתרון (אסטרטגיה) כאשר ההנחה היא שמעצם היותו אדם קיימת לו יכולת אינטליגנטית העולה על זו של המערכת הרובוטית. הפתרון המוצע על ידי האדם מתקבל דרך ממשק המותקן על מערכת מחשב מרוחקת מהרובוט כאשר התקשורת בין האדם לרובוט יכולה להתבצע דרך האינטרנט או דרך תקשורת לוויינית.

האסטרטגיה אותה מציע האדם נלקחת בחשבון על ידי פונקציות הלימוד של הרובוט וככל שגדל מספר הפעמים בו מתערב האדם כך גדלה משתפרת רמת הלימוד של הרובוט ותלותו באדם פוחתת. בשלב מסויים תלות המערכת הרובוטית באדם פוחתת במידה כזו עד שהיא בעצם הופכת ממערכת סמי-אוטונומית למערכת בעלת אוטונומיה מלאה, כלומר, שיעור התערבות האדם מספק מדד לשיפוט רמת האוטונומיות של המערכת – ככל שקיימת פחות התערבות, כך גדלה רמת האוטונומיות שלה והיא הופכת ליותר עצמאית ולבעלת בינה יעילה יותר.

ניתן להשליך את המחקר המבוצע במחלקה לתעשייה וניהול לאפליקציות המפותחות על ידי נאס”א, לדוגמא, ניסיון לניתוק ונענוע לוחות סולאריים בתחנת החלל בדצמבר 2006. במידה וניתן היה ללמד זרוע רובוטית לנער לוח סולארי על קרקע כדור הארץ תוך כדי התמודדות עם מצבים שונים (כגון: זוויות משתנות, חומרים שונים, תנאי תאורה שונים וכו') תוך כדי עירוב האדם במצבים בהם הזרוע הרובוטית הייתה נתקלת בקשיים, את אותו הידע שהיה נצבר עלי ידי מערכות המחשוב של הזרוע הרובוטית תוך כדי ביצוע ניסויים על הקרקע, ניתן היה ליישם בחלל בין אם שיתוף הפעולה עם הזרוע הרובוטית היה מתבצע באמצעות מפעיל אסטרונאוט או בין אם המפעיל היה נמצא על כדור הארץ.

דוגמא נוספת לשילוב מחקר זה במערכות נאס”א הינה מערכת העוסקת בביצוע משימת ניווט על ידי רובוט נייד. אלגוריתם ה- , יכול להיות מיושם על מערכת רובוטית אשר תפקידה לסקור שטח של כוכב לכת מרוחק בכדי לאתר מקורות מים. אם משימת הרובוט הינה ללמוד כיצד לסרוק מרחב של כוכב לכת תוך כדי הימנעות ממכשולים מוגבלת והוא נתקל בקשיים תוך כדי ביצוע משימתו, שילוב אדם בתהליך למידת הרובוט הנע על גבי הכוכב כדאי. מכיוון שכוכבי לכת הינם מרוחקים מכדור הארץ וקבלת המידע הוויזואלי ומיקום הרובוט אינם ידועים בכל רגע נתון, על הרובוט לתפקד בצורה אוטונומית לפחות בחלק ממשך משימתו. חוסר הודאות הנ”ל נובע בדרך כלל ממגבלות כגון הסתרות אטמוספריות או תנאי מזג אוויר ירודים. במידה ובחלק ממשך המשימה הרובוטית לא קיימת בעיית חוסר ודאות אזי יתאפשר למפעיל הרובוט לסייע לו ובכך לקרבו יותר אל רמת סוכן אוטונומי מושלם.

איור 2. רובוט נייד הלומד לבצע משימת ניווט (בתנאי מעבדה)

איור 2. רובוט נייד הלומד לבצע משימת ניווט (בתנאי מעבדה)

3 תגובות

  1. בהקשר לאלגוריתמים של Machine Learning המיושמים על רובוטיקה:

    סטוקאטו פיתחה טכנולוגיית סיווג המסוגלת לסווג סיגנלים (או סדרות נתונים) ללא קשר לסוג שלהם, לכמות שלהם, ולאורך שלהם. הטכנולוגייה מסוגלת להתגבר על החסרונות של שיטות Machine Learning קיימות, כגון המגבלה במספר ה – Features.

    על בסיס הטכנולוגיה סטוקאטו פיתחה כמה מנועי חיפוש – לדוגמא, מנוע חיפוש פיננסי, בו כל מה שנדרש מהמשתמש הוא לציין שם של נייר ערך אמריקאי (תעודת סל, או קרן נאמנות). התוצאות המתקבלות הינן ניירות ערך אחרים שהתנהגו בצורה דומה לנייר הערך שצויין, תוך ציון היתרון שבכל תוצאה (לדוגמא, דמי ניהול נמוכים יותר, תשואה גבוהה יותר, סיכון נמוך וכו’). כך באופן מיידי, המשתמש מקבל אינדיקציה לגבי האם להשקיע בנייר ערך אחר ממה שציין (וכך להימנע למשל מדמי ניהול מיותרים).

    מנוע חיפוש נוסף מיועד לחפש כלים פיננסים שהתנהגו בצורה הפוכה (Inverse).

    החזון של סטוקאטו הינו לכלול במנועי החיפוש שלה את כל הכלים הפיננסים הקיימים.

    http://www.stockato.com

  2. לאבי בליזובסקי האסטרונאוטים יצאו להליכת חלל רביעית מה עים העידכון

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.