חוקרים פיתחו מערכת בינה מלאכותית חדשה שמקדמת רכבים אוטונומיים מעבר ל“ראיית” הולכי רגל בלבד, אל יכולת לצפות את הפעולה הבאה שלהם
מודל בינה מלאכותית חדש מדגים יכולת חסרת תקדים לחזות פעולות אנושיות, באמצעות פרשנות של רמזים חזותיים ורמזי הקשר בזמן אמת. במקום רק להגיב לתנועה, המערכת מנסה להסיק מה האדם כנראה יעשה בהמשך.
חוקרים מהפקולטה להנדסה של אוניברסיטת טקסס A&M ומהמכון המתקדם למדע וטכנולוגיה בקוריאה (KAIST) הציגו מערכת בינה מלאכותית חדשה בשם OmniPredict, שנועדה לשפר את הבטיחות של מכוניות ללא נהג.
OmniPredict היא, לפי החוקרים, המערכת הראשונה שמשתמשת במודל שפה גדול רב־מודלי (Multimodal Large Language Model, MLLM) כדי לחזות כיצד הולכי רגל עלולים להתנהג. היא נשענת על אותה משפחת טכנולוגיות שמפעילה צ’אטבוטים מתקדמים ומערכות זיהוי תמונה, אבל המטרה שלה שונה: לחבר בין מה שהמערכת “רואה” לבין פרטי הקשר, כדי לנבא בזמן אמת מה האדם צפוי לעשות כפעולה הבאה.
בדיקות מוקדמות כבר משכו תשומת לב, משום שהן מצביעות על כך ש-OmniPredict יכולה להגיע לדיוק גבוה במיוחד גם בלי אימון ייעודי ומותאם למשימה.
“ערים הן לא צפויות. הולכי רגל יכולים להיות לא צפויים”, אמר ד”ר סריקנת סריפאלי (Srinkanth Saripalli), החוקר הראשי ומנהל המרכז לכלי רכב אוטונומיים ומערכות חישה. “המודל החדש שלנו הוא הצצה לעתיד שבו מכונות לא רק רואות מה קורה, אלא גם צופות מה בני אדם צפויים לעשות”.
שכבה חדשה של “חוכמת הרחוב”
ככל שמפתחים מנסים להפוך נהיגה אוטונומית לבטוחה יותר, OmniPredict מוסיפה שכבה חדשה של מודעות “רחוב”, ומתקרבת לאינטואיציה דמוית־אדם.
במקום להגיב רק לתנועה הנוכחית של הולך הרגל, היא מנסה לחזות מה הוא יעשה בהמשך. אם השיטה תעבוד כפי שמתוכנן, היא עשויה להשפיע על אופן הפעולה של רכבים אוטונומיים בסביבות עירוניות צפופות, ולאפשר ניווט חלק יותר ברחובות עמוסים.
“זה פותח דלתות להפעלה בטוחה יותר של רכבים אוטונומיים, לפחות תקריות שקשורות בהולכי רגל, ומעבר מתגובה לסכנה – למניעה יזומה שלה”, אמר סריפאלי.
לדבריו, גם המרחב הפסיכולוגי עשוי להשתנות. אפשר לדמיין מצב שבו אדם עומד במעבר חציה, ובמקום ליצור קשר עין עם נהג אנושי, הוא יודע שרכב שמונע ב-AI עוקב אחר המיקום שלו ומתכנן בהתאם לצעד הבא הסביר שלו.
“פחות עימותים מתוחים. פחות כמעט־תאונות. הרחובות אולי אפילו יזרמו בצורה חופשית יותר. הכול בגלל שרכבים מבינים לא רק תנועה, אלא – ובעיקר – מניעים”, אמר.
מעבר למעברי חציה: חיזוי התנהגות גם בסביבות מורכבות
המשמעויות של OmniPredict אינן מוגבלות לרחובות הומים, צמתים כאוטיים או מעברי חציה עמוסים.
“אנחנו פותחים את הדלת ליישומים מרגשים”, אמר סריפאלי. “למשל, האפשרות שמכונה תזהה, תבין ותנבא תוצאות של אדם שמציג סימנים מאיימים יכולה להיות בעלת השלכות חשובות”.
באופן רחב יותר, מערכת AI שמזהה שינויי יציבה, היסוס, כיוון גוף, או סימני לחץ, עשויה להיות משמעותית עבור צוותים שעוסקים בפעילות צבאית ובפעילות חירום.

“זה יכול לעזור לסמן ולהתריע על אינדיקציות מוקדמות לסיכון, או לספק שכבת מודעות מצבית נוספת”, אמר סריפאלי.
בתרחישים כאלה, הגישה עשויה לאפשר לאנשי שטח לפרש במהירות סביבות מורכבות ולקבל החלטות מהר יותר, על בסיס מידע טוב יותר.
“המטרה שלנו בפרויקט אינה להחליף בני אדם, אלא לעזור להעצים אותם באמצעות שותף חכם יותר”, אמר.
מבחן מציאות: מול מאגרי JAAD ו-WiDEVIEW
מערכות נהיגה אוטונומית “קלאסיות” נשענות על מודלי ראייה ממוחשבת שאומנו על אלפי מאגרים ותמונות. הן יכולות להיות חזקות, אבל מתקשות להסתגל לתנאים משתנים.
“שינויי מזג אוויר, התנהגות בלתי צפויה של אנשים, אירועים נדירים, והכאוס של רחוב עירוני – כל אלה יכולים להשפיע גם על מערכות הראייה המתוחכמות ביותר”, אמר סריפאלי.
OmniPredict פועלת אחרת. התוצאה היא AI שלא רק “רואה” סצנה, אלא מפרש אותה ומנסה לחזות כיצד כל רכיב בה עשוי לזוז, תוך התאמה בזמן אמת.
הצוות בדק את OmniPredict מול שניים ממדדי הייחוס הקשוחים במחקר התנהגות הולכי רגל – מאגרי JAAD ו-WiDEVIEW – בלי להעניק למערכת אימון ייעודי מוקדם. לפי המאמר שפורסם ב-Computers and Electrical Engineering, OmniPredict השיגה דיוק של 67% ועקפה מודלים עדכניים בכ־10%. היא שמרה על ביצועים גם כשהחוקרים הוסיפו מידע הקשרי, כמו הולכי רגל שמוסתרים חלקית או אנשים שמביטים לכיוון הרכב.
לפי הדיווח, המערכת גם הציגה תגובה מהירה יותר, יכולת הכללה טובה יותר בין הקשרי־כביש שונים, וקבלת החלטות עמידה יותר ממערכות מסורתיות – סימנים מעודדים לקראת פריסה עתידית בעולם האמיתי.
“הביצועים של OmniPredict מרגשים, והגמישות שלה מרמזת על פוטנציאל רחב בהרבה בעולם האמיתי”, אמר סריפאלי.
מכוניות שמנבאות ולא רק מגיבות
OmniPredict עדיין מוגדרת כמודל מחקר, ולא כמערכת שמוכנה לנסיעה בכביש. עם זאת, היא מצביעה על עתיד שבו רכבים אוטונומיים יסתמכו פחות על “כוח גס” של למידה חזותית, ויותר על הסקה התנהגותית.
באמצעות שילוב בין הסקה לבין תפיסה, המערכת מאפשרת סוג חדש של “אינטליגנציה משותפת”: העולם לא רק נעשה אוטומטי, אלא גם נעשה אינטואיטיבי בהרבה.
“OmniPredict לא רק רואה מה אנחנו עושים. היא מבינה למה אנחנו עושים את זה, וכעת יכולה לנבא מתי אנחנו צפויים לבצע פעולה”, אמר סריפאלי.
אם מכוניות שמבוססות AI יידעו לקרוא את הצעד הבא שלנו, הדרך קדימה עשויה להפוך חכמה בהרבה.
עוד בנושא באתר הידען: