דרפ"א מממנת פיתוח של מעבד מסוג חדש – מעבד ניתוח גרפים

מעבד מסוג חדש לגמרי בשם HIVE שאינו בארכיטקטורת פון ניומן ממומן על ידי דרפא (DARPA), הסוכנות לפרויקטי מחקר צבאיים מתקדמים של ארצות הברית, בסכום של 80 מיליון דולר על פני ארבע וחצי שנים.

יצרניות השבבים אינטל וקוואלקום משתתפות בפרויקט, יחד עם מעבדה לאומית, אוניברסיטה וקבלנית משרד ההגנה נורתרופ גרומן. המעבדה הלאומית של צפון מערב הפסיפיק (ריצ'לנד, וושינגטון) ואוניברסיטת ג'ורג'יה טק עוסקות ביצירת כלי תוכנה עבור המעבד ונורתרופ גרומן תבנה מרכז בבולטימור שיחשוף ויעביר את צורכי ניתוח הגרפים של משרד ההגנה למה שמכונה מעבד ניתוח הגרפים (GAP) הראשון בעולם.

"כשאנחנו מתבוננים בארכיטקטורות של מחשבים כיום, הם משתמשים באותה ארכיטקטורת [ג'ון] פון ניומן שהומצאה בשנות הארבעים. מעבדים מרכזיים ומעבדים גרפיים הפכו למקבילים, אבל כל אחת מהליבות היא עדיין מעבד פון ניומן", אמר טרונג טראן, מנהל תוכנית במשרד לטכנולוגיות של מיקרו מערכות (MTO) בדרפא, ל-EE Times בראיון בלעדי.

HIVE הוא לא פון ניומן בגלל הדלילות של הנתונים שלו והיכולת לבצע בו-זמנית תהליכים שונים באזורים שונים של הזיכרון בו-זמנית", אמר טרונג. "הגישה הלא- פון ניומנית הזאת מאפשרת מפה אחת גדולה שמעבדים רבים יכולים לגשת אליה באותו הזמן, כשכל אחד מהם משתמש בזיכרון טיוטה משלו ובו-זמנית מבצע פעולות פיזור ואיסוף בזיכרון גלובלי".

מעבדי ניתוח גרפים לא קיימים כיום, אבל הם נבדלים תיאורטית ממעבדים מרכזיים וגרפיים באופנים חשובים. ראשית כל, הם ממוטבים לעיבוד של פרימיטיבים של גרפים דלילים. בגלל שהפריטים שהם מעבדים ממוקמים באופן דליל בזיכרון גלובלי, יש בהם גם ארכיטקטורת זיכרון חדשה שיכולה לגשת למיקומים בזיכרון שממוקמים באופן אקראי במהירויות גבוהות מאוד (עד טרה-בייטים לשנייה).

שבבי הזיכרון הנוכחיים ממוטבים לגישה למיקומים ברצף ארוך (כדי למלא את המטמונים שלהם) במהירויות הכי גבוהות שלהם, שהן בתחום האיטי בהרבה של גיגה-בייטים לשנייה. מעבדי HIVE, לעומת זאת, ייגשו לנתונים אקראיים של שמונה בייטים מזיכרון גלובלי במהירות הכי גבוהה שלהם, ואז יעבדו אותם באופן עצמאי באמצעות זיכרון הטיוטה שלהם. במיפרט של הארכיטקטורה כלולה גם יכולת הגדלה עד לכל מספר של מעבדי HIVE שיידרשו כדי לבצע אלגוריתם גרפים ספציפי.

"מכל הנתונים שנאספים כיום, רק כעשרים אחוז שימושיים — לכן הם דלילים — ומסיבה זאת הגרנולריות של שמונה בייטים שלנו הרבה יותר יעילה לבעיות של ביג דאטה", אמר טראן.

ביחד, יחידת העיבוד האריתמטי החדשה שממוטבת לניתוח גרפים בתוספת השבבים עם ארכיטקטורת הזיכרון החדשה ישתמשו לפי המיפרט של דרפא בפי אלף פחות חשמל מאשר השימוש במחשבי העל הנוכחיים. המשתתפות, במיוחד אינטל וקוואלקום, יקבלו גם את הזכויות למסחר את ארכיטקטורות המעבד והזיכרון שהן ממציאות כדי ליצור HIVE.

מעבד ניתוח הגרפים נחוץ, לדברי דרפא, לבעיות של ביג דאטה, שבדרך כלל כוללות קשרי "רבים לרבים" ולא "רבים לאחד" או "אחד לאחד" שלהם המעבדים של היום ממוטבים. דוגמה צבאית, לדברי דרפא, יכולה להיות האיגרות הדיגיטליות הראשונות של מתקפת סייבר. דוגמה אזרחית, לדברי אינטל, יכולה להיות כל האנשים שקונים מאמזון שממופים לכל הפריטים שכל אחד מהם קנה (בבירור קשר הרבים לרבים מתאר את הקשר אנשים למוצרים).

"מנקודת המבט שלי, הבעיה הגדולה הבאה שצריך לפתור היא ביג דאטה, שכיום מנתחים אותו באמצעות רגרסיה שאינה יעילה לקשרים בין נתונים שהם מאוד דלילים", אמר טראן. "מצאנו שהמעבד המרכזי והמעבד הגרפי משאירים פער גדול בין גודל הבעיה ועושר התוצאות, ואילו תורת הגרפים מתאימה באופן מושלם ואנחנו גם צופים לה שוק מסחרי מתפתח".

קטגוריות: מיחשוב ורובוטיקה
תגיות: ביג דאטה, דרפ"א, מדעי המחשב, מחשוב, מעבדים, עיבוד מידע

אבי בליזובסקי

עורך אתר הידען ([email protected])

לכל הכתבות של המחבר

5 תגובות

קונאן הגיב:

26 באוגוסט 2017 בשעה 16:36

למיטב הבנתי, עיתון "הידען" אמור להציג ולהסביר מחקרים חדשניים ופורצי-דרך מהעולם כולו לקהל הרחב שדובר עברית. גם אני, בעל דוקטוראט בכימיה ותואר שני במנהל-עסקים, מחשיב את עצמי ל"קהל רחב".
למרות-זאת, מהמאמר הזה שתורגם לעברית (ואני מניח שזו השפה העברית לפי הכתב ומילות הקישור שמופיעות בו) לא הבנתי דבר וחצי-דבר לגבי הרעיון הכללי ומדוע זה כ"כ חדשני וחשוב.
אם זה עיתון לקהל הרחב – אנא תרגמו אותו לא רק ע" זריקת כל המאמר ל-Google-Translate, אלא גם תרגום המילים שמוכרות רק לאנשי המקצוע לעברית, גם אם זה יאריך במעט את המאמר וישנה את הציביון שלו ל-"פחות מדעי".
ירון הגיב:

27 ביוני 2017 בשעה 04:19

הפיתוח כאן הוא דוגמא לאבולוציה מדעית. HIVE קיים בתוכנה כאלגוריתם ביזור חישוב בשפת PHP ואולי כחלק מפרוטוקול HADOOP, שזה היום חם בניתוח ביג דאטא.
HADOOP זה שם בובת פילון של הילד של מתכנת GOOGLE שהמציא את הפרוטוקול. הכוונה שלו היתה להראות שהפרוטוקול רב עוצמה כמו פיל, ונעים לשימוש כמו פילון. אני כעת מנסה לגייס בעבודתי סכום לא גבוה מדי של X,000 $ לתוכנה כזו. מה שקיים היום מבוזר על 12 מעבדים,או אפילו אולי עד 1,000 מעבדים, הגיעו למסקנה באינטל שניתן לרכז בשבב אחד. אז מלבד זה שזו קפיצה טכנולוגית, זהו עוד צעד לדעתי בפיתוח אינטליגנציה קוגניטיבית. ברגע שהתפיסה והחישה מואצים בעשר בחזקת, מתאפשרת בניית רמות מופשטות חדשות של תובנה בתוכנה, שלא התאפשרה קודם.
ויש פה עוד סממן. אינטל שהיתה רגילה להעתיק ולפתח בעצמה לעצמה,פונה ל DARPA למימון 80 מיליון $.
סכום שהייתה מוציאה בעבר לבד. הם למדו שבפיתוח סיכון אפשר להתחלק במימון. וכדי להתחרות בענקים GOOGLE שעושה בעצמה, ו IBM שמקבלת מימון DARPA ב-2 ארכיטקטורות שלה: מחשב קוונטי, מחשב קוגניטיבי, גם הם שם. למדו. עד היום יש ניסיון שלילי ברכישת חברות מבחוץ. אינטל לא משכילה לפתח אותן. כך היה עם DSP, עם OPLUS. חברות טובות שברגע שנרכשו ע"י אינטל הפסידו. מעבד ARM שפותח ע"י החלק ב DSP שלא התמזג עם אינטל, היום הוא טכנולוגית הליבה במעבדים של הפלאפונים הסלולריים. מעניין איך יהיה במובילאיי. מלבד זה המאמר נתן לי תובנה לגבי אלגוריתם אחר בתוכנה שיכול לעשות דברים דומים, תוך ניצול המתימטיקה הפעם ולא פרוטוקול מדעי המחשב, וזה כבר לעצמי בעצמי.
ירון הגיב:

26 ביוני 2017 בשעה 21:30

אבי. התגעגענו לשמוע את קולך.
נושא אחר: אפשר לפתור את בעיית הדלילות באלגוריתם. יש היום תיאוריה מתימטית לזה. מיכאל אלעד שהופיע כאן עם ורדן פפיאן, הוא מתימטיקאי טוב גם בתחום ההוא, וגם יונינה אלדר, ואחרים.
ירון הגיב:

26 ביוני 2017 בשעה 21:27

מעבד מהיר פי 1000 מהליבות הקיימות היום ברוב המשימות. השאלה איך מגדירים גרפים. במובן הרחב רוב המידע הוא גרפים. מעניין שאינטל מקבלת מימון משרד הביטחון האמריקאי. 80 מיליון דולר היה פעם כסף בינוני עבורם. הם למדו לשתף פעולה.

http://www.darpa.mil/attachments/HIVE_Proposers_Day_PM_Briefing.pdf
101 הגיב:

25 ביוני 2017 בשעה 10:02

זה נראה כאילו הפתרון הזה יפתור את הבעיה של צוואר בקבוק פול-ניומן ויזניק את הביצועים גם של המעבדים הביתיים על ידי ביטול הצוואר בקבוק בגישה לזיכרון.

כתיבת תגובה

אתר זו עושה שימוש ב-Akismet כדי לסנן תגובות זבל. פרטים נוספים אודות איך המידע מהתגובה שלך יעובד.