חוקרים בטכניון פיתחו פלטפורמה המאיצה פי 1,000 את תהליך הלמידה של מערכות בינה מלאכותית

מכיוון שהלמידה מתוך דוגמאות דורשת כוח מחשוב רב היא מבוצעת לרוב במחשבים המכילים מעבדים גרפיים (GPU) המצטיינים בכך. עם זאת, מהירותם של מעבדים אלה עדיין נמוכה יחסית לקצב הלימוד הרצוי של רשתות הנוירונים

ד"ר שחר קוטינסקי (משמאל) עם הדוקטורנטית צפנת גרינברג-טולדו. צילום: ניצן זוהר, דוברות הטכניון
ד"ר שחר קוטינסקי (משמאל) עם הדוקטורנטית צפנת גרינברג-טולדו. צילום: ניצן זוהר, דוברות הטכניון

חוקרים בפקולטה להנדסת חשמל ע"ש ויטרבי בטכניון פיתחו חומרה חדשנית המאיצה את תהליך הלמידה של מערכות בינה מלאכותית. את המחקר הובילו ד"ר שחר קוטינסקי והדוקטורנטית צפנת גרינברג-טולדו, והשתתפו בו הסטודנטים רועי מזור ואמיר חג' עלי. מאמרם פורסם בכתב העת IEEE Transactions on Circuits and Systems שמוציאה האגודה הבינלאומית למהנדסי חשמל ואלקטרוניקה (IEEE).

בשנים האחרונות חלה התקדמות משמעותית בעולם הבינה המלאכותית, בעיקר הודות למודלים של רשתות נוירונים עמוקות (DNNs). רשתות אלה, שתוכננו בהשראת המוח האנושי ודרכי הלמידה של האדם, מבצעות בהצלחה חסרת תקדים משימות מורכבות כגון נהיגה אוטונומית, עיבוד שפה טבעית, זיהוי רגשות בטקסט, תרגום, זיהוי תמונה ופיתוח טיפולים רפואיים חדשניים. זאת באמצעות למידה עצמית מתוך מאגר עצום של דוגמאות – תמונות, למשל. טכנולוגיה זו מתפתחת במהירות בקבוצות מחקר אקדמיות כמו גם בחברות ענק כגון פייסבוק וגוגל, הרותמות אותה לצורכיהן.

מכיוון שהלמידה מתוך דוגמאות דורשת כוח מחשוב רב היא מבוצעת לרוב במחשבים המכילים מעבדים גרפיים (GPU) המצטיינים בכך. עם זאת, מהירותם של מעבדים אלה עדיין נמוכה יחסית לקצב הלימוד הרצוי של רשתות הנוירונים ולכן המעבד עדיין מהווה צוואר בקבוק בתהליך זה. יתר על כן, השימוש במעבדים צורך אנרגיה רבה. לדברי ד"ר קוטינסקי, "למעשה יש לנו כאן חומרה שנועדה במקור לשימושים אחרים – גרפיקה, בעיקר – והיא אינה עומדת בקצב המהיר של הפעילות המתרחשת ברשתות הנוירונים. כדי לפתור את הבעיה הזאת אנחנו חייבים חומרה ייעודית שמותאמת לעבודה עם רשתות נוירונים עמוקות."

ואכן, קבוצת המחקר של ד"ר קוטינסקי פיתחה, ברמה התאורטית, מערכות חומרה המותאמות במיוחד לעבודה עם רשתות אלה ומאפשרות לרשת הנוירונים לבצע את שלב הלמידה במהירות גבוהה ובאנרגיה מופחתת. לדברי ד"ר קוטינסקי, "בהשוואה לעבודה עם מעבדים גרפיים, החומרה שלנו משפרת את מהירות החישוב פי 1,000 ומצמצמת את הצריכה האנרגטית ב-80%."

החומרה שפיתחה הקבוצה מהווה פריצת דרך ושינוי תפישתי של ממש: במקום שיפור של מעבדים קיימים פיתחו חוקרי הטכניון מבנה של מכונת חישוב תלת-ממדית המשלבת בתוכה את הזיכרון. "במקום פיצול בין היחידות המבצעות את החישובים לזיכרון האחראי לשמירת המידע, אנחנו עושים הכל בתוך הממריסטור – רכיב זיכרון בעל כוח חישובי המשמש במקרה זה באופן ייעודי לעבודה עם רשתות נוירונים עמוקות."

אף שמדובר בעבודה תאורטית, הקבוצה כבר הדגימה את יישומו של הפיתוח ברמת הסימולציה. לדברי ד"ר קוטינסקי, "הפיתוח שלנו נועד לעבודה עם אלגוריתם הלמידה 'מומנטום', אבל הכוונה היא להמשיך בפיתוח החומרה כך שתתאים גם לאלגוריתמים נוספים. יתכן שבמקום כמה רכיבי חומרה שונים נפתח חומרה דינמית, רב תכליתית, שתוכל להתאים את עצמה לאלגוריתמים שונים.

למאמר המדעי

שיתוף ב print
שיתוף ב email
שיתוף ב whatsapp
שיתוף ב linkedin
שיתוף ב twitter
שיתוף ב facebook

3 תגובות

  1. כל הכבוד. יש מחקרים ויש מחקרים. יש פיתוחים ויש פיתוחים. המערכת הזו מצויה ברף היותר עליון.

  2. לגוגל יש את פלטפורמת ה- TPU לחישובים מהירים על טנסורים (בדור שלישי עכשיו). האם הפיתוח בטכניון יותר טוב מזה?

כתיבת תגובה

האימייל לא יוצג באתר.

דילוג לתוכן