IBM מעמידה לרשות קהילת המחקר מיליון תמונות פנים מקודדות לשיפור מערכות זיהוי פנים

מעבדות המחקר של IBM מעמידות לרשות קהילת המחקר העולמית אתDiversity in Faces – ערכה המכילה נתונים על מיליון תמונות פנים שעברו תהליך קידוד • ד"ר איה סופר, סגנית נשיא למחקר טכנולוגיות בינה מלאכותית ב-IBM העולמית: "ערכת הנתונים תסייע בפיתוח מערכות בינה מלאכותית הוגנות יותר. זוהי קריאה לקהילת המחקר העולמית לתרום להמשך המחקר בתחום ולקדם את הנושא החשוב הזה"

יישומי בינה מלאכותית מציגים כיום יכולות משתפרות והולכות לביצוע משימות מורכבות של עיבוד נתונים, למשל המרת דיבור לטקסט, תרגום או זיהוי הקשרים, עצמים ותמונות. יישומים אלה נשענים על שימוש בלמידה עמוקה והתמודדות עם כמויות עצומות של נתונים לצורך הכנת מודלים מדויקים יותר – אך העוצמה של הטכנולוגיות הללו היא גם לעיתים החולשה שלהן.

מערכות בינה מלאכותית לומדות את מה שמלמדים אותן: אם תהליך הלימוד (המכונה "אימון") אינו מבוסס על ערכות נתונים מגוונות דיין, הדיוק וההוגנות של התובנות שיפיקו המערכות הללו עלולים להיפגע. האתגר באימון מערכות בינה מלאכותית מתבטא באופן הברור ביותר בכל הנוגע לטכנולוגיות זיהוי פנים. קיים קושי בבניית מערכות שכאלה העומדים בציפיות בכל הנוגע להוגנות.

לב הבעיה אינו טכנולוגי כי אם אופן האימון של המערכות. על מנת שהן יפעלו באופן המצופה, והתוצאות שיפיקו יהפכו מדויקות יותר ויותר לאורך זמן, חייב המידע המשמש לאימון המערכות להיות מגוון ולהציע כיסוי של מגוון אנושי רחב ככל הניתן. ערכות הנתונים המשמשות לאימון המערכת חייבות להיות מקיפות ומגוונות מספיק כדי שהטכנולוגיה תלמד את כל הדרכים שבהן שונות פנים אנושיות אלה מאלה, ותזהה באופן מדויק את ההבדלים האלה במגוון רחב של מצבים. נתוני התמונות חייבים לשקף את ההתפלגות והשונות של מאפיינים בתווי פנים כפי שאנו רואים אותם בכל העולם.

זו הסיבה שבגללה רותמת עתה IBM את עוצמת המדע על מנת לפתח מערכות בינה מלאכותית הוגנות ומדויקות יותר. בימים אלה מעמידה חטיבת המחקר של IBM לרשות קהילת המחקר העולמית אתDiversity in Faces – ערכה (data set) הכוללת נתונים מקודדים של מיליון תמונות פנים אנונימיות של בני אדם, שנבחרו כמייצגים ההולמים ביותר של גיוון אנושי מתוך מאגר ציבורי של 100 מיליון תמונות פנים (מאגר YFCC100M). מיליון התמונות בערכה עברו קידוד באמצעות עשר שיטות קידוד עצמאיות המתועדות בספרות המדעית. זוהי ערכת הנתונים הראשונה מסוגה הזמינה לשימוש חופשי של קהילת המחקר והפיתוח העולמית ומטרתה העמדתה לרשות החוקרים היא קידום המחקר בתחום ההוגנות והדיוק של טכנולוגיות זיהוי פנים.

קידוד התמונות בערכה כלל מדידה אובייקטיבית של פנים אנושיות, דוגמת מבנה גולגולת – אורך כולל, אורך האף, גובה המצח ואפיונים סובייקטיביים יותר דוגמת הערכה מילולית על ידי בני אדם אודות גילו של המצולם והמגדר אליו הוא משתייך.
איך אנו מודדים ומבטיחים את המגוון הנדרש של פנים אנושיות? ראשית אנו מכירים את האופן שבו שונות פנים בין גילים, מגדרים, או גוון עור, ואת האופן שבו הן מוגדרות במסגרת המאפיינים הללו. אבל כפי שהראו גם מחקרים קודמים, משתנים אלה רק חלק מהמצרף הכולל, ואינם מספיקים על מנת לאפיין את כל המגוון של פנים אנושיות. ממדים דוגמת סימטריה של הפנים, ניגודיות, מנח של הפנים, אורך ורוחב של הרכיבים השונים (עיניים, אף, מצח) חשובים גם הם.

"IBM גאה לאפשר גישה לערכת הנתונים החדשה מתוך מטרה לקדם את המחקר הקולקטיבי ולתרום ליצירת מערכות בינה מלאכותית הוגנות יותר", אמרה ד"ר איה סופר, סגנית נשיא למחקר טכנולוגיות בינה מלאכותית ב-IBM העולמית. "בעוד שמעבדות המחקר של IBM מחויבות להמשך המחקר של מערכות זיהוי פנים הוגנות יותר, איננו מאמינים שאנו יכולים לעשות זאת לבדנו. העמדת ערכת הנתונים לרשות קהילת המחקר העולמית היא קריאה לאחרים לתרום להמשך המחקר בתחום ולקדם את הנושא החשוב הזה על סדר היום של העולם המדעי".

לאתר הערכה המיועד לקהילה המדעית