סיקור מקיף

פיענוח הקופסה השחורה של הבינה המלאכותית – מדענים חושפים תוצאות בלתי צפויות

חוקרים באוניברסיטת בון בגרמניה בודקים כיצד עובדים המנועים הפנימיים של יישומי למידה חישובית במחקר תרופות. בין היתר הם גילו כי מערכות הבינה המלאכותית די התעצלו

"הקופסא השחורה" של הבינה המלאכותית. <a href="https://depositphotos.com. ">המחשה: depositphotos.com</a>
“הקופסא השחורה” של הבינה המלאכותית. המחשה: depositphotos.com

טכנולוגיית הבינה המלאכותית התקדמה במהירות, אך פעולותיה הפנימיות לעתים קרובות נותרות עלומות, מאופיינות באופי של “קופסה שחורה” שבה התהליך להגעה למסקנות אינו גלוי. עם זאת, פריצת דרך משמעותית הושגה על ידי פרופ’ ד”ר יורגן באיוראת וצוותו, מומחי כימו-אינפורמטיקה באוניברסיטת בון. הם פיתחו טכניקה שחושפת את המנגנונים התפעוליים של מערכות בינה מלאכותית מסוימות המשמשות במחקר פרמצבטי.

במפתיע, ממצאיהם מצביעים על כך שמודלים אלה של בינה מלאכותית מסתמכים בעיקר על שליפת נתונים קיימים במקום למידת אינטראקציות כימיות ספציפיות לצורך חיזוי יעילות תרופות. תוצאותיהם פורסמו לאחרונה ב-Nature Machine Intelligence.

איזו מולקולת תרופה היא היעילה ביותר? חוקרים מחפשים בלהט אחר חומרים פעילים יעילים למאבק במחלות. תרכובות אלה לעתים קרובות נקשרות לחלבון, שבדרך כלל הם אנזימים או קולטנים המפעילים שרשרת פעולות פיזיולוגיות ספציפית.

במקרים מסוימים, מולקולות מסוימות אף מיועדות לחסום תגובות בלתי רצויות בגוף – כמו תגובה דלקתית מוגזמת. נוכח שפע התרכובות הכימיות הזמינות, חיפוש זה דומה במבט ראשון לחיפוש מחט בערמת שחת. גילוי תרופות מנסה לכן להשתמש במודלים מדעיים כדי לחזות אילו מולקולות יתאימו בצורה הטובה ביותר לחלבון היעד ויקשרו אליו בחוזקה. מועמדים פוטנציאליים אלה לתרופות נבדקים לאחר מכן בפירוט רב יותר במחקרים ניסויים.

מאז התקדמות הבינה המלאכותית, גם מחקר גילוי תרופות משתמש יותר ויותר ביישומי למידה חישובית. אחד מיישומים אלה, “רשתות עצביות גרפיות” (GNN), מספק אחת ממספר הזדמנויות ליישומים כאלה. הם מותאמים לחזות, לדוגמה, עד כמה חזק מולקולה מסוימת נקשרת לחלבון מטרה. לשם כך, מודלי GNN מאומנים בעזרת גרפים המייצגים תגובות (קומפלקסים) הנוצרת בין חלבונים לתרכובות כימיות (ליגנדים).

גרפים בדרך כלל מורכבים מצמתים המייצגים עצמים, ומקשתות המייצגות יחסים בין צמתים. בייצוגי גרף של קומפלקסי חלבון-ליגנד, קשתות מחברות רק צמתי חלבון או ליגנד, מייצגות את המבנים שלהם, בהתאמה, או צמתי חלבון וליגנד, מייצגות אינטראקציות ספציפיות בין חלבון לליגנד.

“מנועי ה-GNN מגיעים לחיזויים שלהם הוא כמו קופסה שחורה שאין לנו מבט פנימה אליה,” אומר פרופ’ באיוראת. חוקר הכימו-אינפורמטיקה מהמכון LIMES באוניברסיטת בון, המרכז הבינלאומי בון-אאכן לטכנולוגיות מידע (B-IT), ומכון למאר ללמידה חישובית ובינה מלאכותית בבון, יחד עם עמיתים מאוניברסיטת סאפיינצה ברומא, ניתח בפירוט האם רשתות עצביות גרפיות לומדות באמת אינטראקציות חלבון-ליגנד כדי לחזות עד כמה חומר פעיל נקשר לחלבון מטרה.

החוקרים ניתחו סך הכל שש ארכיטקטורות שונות של GNN באמצעות השיטה המכונה EdgeSHAPer שפיתחו ומתודולוגיה קונספטואלית שונה לצורך ההשוואה ביניהן. תוכניות מחשב אלה “סורקות” האם GNN לומד את האינטראקציות החשובות ביותר בין תרכובת לחלבון ובכך מנבא את עוצמת הליגנד, כפי שהחוקרים מצפים וצופים – או שהבינה המלאכותית מגיעה לחיזויים בדרכים אחרות.

“ה-GNN מאוד תלויים בנתונים שהם מאומנים איתם”, אומר מחברו הראשון של המחקר, ד”ר אנדראה מסטרופייטרו מאוניברסיטת סאפיינצה ברומא, שערך חלק מעבודת הדוקטורט שלו בקבוצתו של פרופ’ באיוראת בבון.

המדענים אימנו את ששת ה-GNN עם גרפים שהופקו ממבנים של קומפלקסי חלבון-ליגנד, שעבורם אופן הפעולה וחוזק הקשירה של התרכובות לחלבוני המטרה שלהם כבר היו ידועים מניסויים. ה-GNN המאומנים נבחנו לאחר מכן על קומפלקסים אחרים. ניתוח ה-EdgeSHAPer שבא לאחר מכן אפשר להבין כיצד GNN מייצרים חיזויים חיוביים לכאורה.

“אם ה-GNN עושים מה שמצופה מהם, הם צריכים ללמוד את האינטראקציות בין החומר הפעיל לחלבון המטרה והחיזויים צריכים להיקבע על ידי קביעת סדר עדיפויות לאינטראקציות ספציפיות”, מסביר פרופ’ באיוראת. על פי ניתוחי הצוות, עם זאת, ששת ה-GNN נכשלו במידה רבה בביצוע. רוב ה-GNN למדו רק אינטראקציות חלבון-תרופה בודדות והתמקדו בעיקר בליגנדים. לדברי באיוראת: “כדי לחזות את חוזק הקשירה של מולקולה לחלבון מטרה, המודלים הסתמכו בעיקר על ‘זכירת’ מולקולות כימית דומות שנתקלו בהן במהלך האימון ונתוני הקשירה שלהן, בלי קשר לחלבון המטרה. הדמיון הכימי שנלמד אז הכתיב במידה רבה את החיזויים.”

על פי המדענים, הדבר דומה במידה רבה ל”אפקט האנס החכם”. אפקט זה מתייחס לסוס שכביכול יכול היה לספור. כמה פעמים שהאנס דפק בפרסה שלו אמור היה לציין את התוצאה של החישוב. כפי שהתברר מאוחר יותר, עם זאת, הסוס לא יכול היה לחשב בכלל, אלא הסיק תוצאות מגוונים בהבעות הפנים והתנועות של בן לווייתו.

מה משמעות הממצאים הללו עבור מחקר גילוי תרופות? “לרוב אין זה סביר ש-GNN לומדים אינטראקציות כימיות בין חומרים פעילים לחלבונים”, אומר החוקר. החיזויים שלהם מוערכים יתר על המידה כיוון שניתן להפיק חיזויים באיכות דומה באמצעות ידע כימי ושיטות פשוטות יותר. עם זאת, המחקר גם מציע הזדמנויות לבינה מלאכותית. שניים מהמודלים שנבחנו הראו נטייה ברורה ללמוד יותר אינטראקציות כאשר עוצמת הקישור של תרכובות הבדיקה גדלה. “כדאי להסתכל על כך ביתר פירוט”, אומר באיוראת. אולי ניתן לשפר GNN אלה בכיוון הרצוי באמצעות ייצוגים וטכניקות אימון מתוקנים. עם זאת, יש לטפל בזהירות בהנחה שניתן ללמוד גדלים פיזיקליים על בסיס גרפים מולקולריים. “בינה מלאכותית אינה קסם שחור”, אומר באיוראת.

הוא רואה את פרסום הגישה הפתוחה הקודמת של EdgeSHAPer וכלים אחרים שפותחו במיוחד כגישות מבטיחות להאיר את הקופסה השחורה של מודלי בינה מלאכותית. הגישה הנוכחית של צוותו מתמקדת ב-GNN וב”מודלי שפה כימיים” חדשים.

“פיתוח שיטות להסברת חיזויים של מודלים מורכבים הוא תחום חשוב במחקר בינה מלאכותית. יש גם גישות לארכיטקטורות רשת אחרות כמו מודלי שפה שעוזרות להבין טוב יותר כיצד למידה חישובית מגיעה לתוצאותיה,” אומר באיוראת. הוא מצפה שדברים מרתקים יקרו בקרוב גם בתחום ה”בינה מלאכותית המוסברת” במכון למאר, שם הוא חוקר ראשי ויושב ראש תחום הבינה המלאכותית במדעי החיים.

מקור: “Learning characteristics of graph neural networks predicting protein–ligand affinities” מאת Andrea Mastropietro, Giuseppe Pasculli ו- Jürgen Bajorath, 13 בנובמבר 2023, Nature Machine Intelligence.

DOI: 10.1038/s42256-023-00756-9

הודעה לעיתונות זו מציגה מחקר חשוב על הבנת האופן שבו מודלים של למידה עמוקה פועלים בתחום גילוי תרופות. החוקרים מאוניברסיטת בון הראו שרשתות עצביות גרפיות, שיטה נפוצה לחיזוי קישור חלבון-תרופה, מסתמכות בעיקר על זיכרון נתונים קודמים ופחות על למידת אינטראקציות ביוכימיות ספציפיות. הממצאים מדגישים את הצורך בכלים נוספים להבנת “הקופסה השחורה” של בינה מלאכותית ושיפור המודלים. ייתכן שמחקר זה יוביל לפיתוח מודלים משופרים יותר לגילוי תרופות בעתיד.

עוד בנושא באתר הידען:

2 תגובות

  1. מדהים שעדיין לא ברור לאנושות גם בשלב הזה, לאחר שנים של עבודה עם רשתות
    נוירונים איך בדיוק העסק עובד. חקר מדעי המחשב הגיע להבנה טובה של אלגוריתמים מתקדמים אבל עדיין לא בנושא הזה.
    אולי צריך עזרה של בינה מלאכותית כדי להבין איך עובדת בינה מלאכותית כזאת.
    עוד דבר, התחום של בינה מלאכותית מרגש אבל גם מפחיד.
    המחשב יחליף בקרוב הרבה בעלי מקצוע?
    אני חושב שכן.
    מקצועות שלדעתי בסכנה קרובה:
    מורים, רואי חשבון, מזכירות, מנהלים, מנהלי פרוייקטים,
    נהגים, יועצים בכל התחומים, מלווים של אנשים מבוגרים, רופאים, ועוד.
    מקצועות שלדעתי בסכנה בתקופה הקצת יותר רחוקה:
    שיפוצניקים, בנאים.
    אבל גם הם בסכנה, למשל אפשר לראות את ההתקדמות עם הרובוט של טסלה.
    סכנה גדולה היא בשילוב של בינה מלאכותית במלחמות. כבר לא יעזור להתחבא,
    כלי הנשק עם בינה מלאכותית ימצא אותך וידע לתקוף אותך בנקודה החלשה שלך.
    בפן החיובי, בינה מלאכותית תבצע את העבודה שלנו בצורה יותר טובה ויכולה
    למשל גם למצוא תרופות יותר טובות.
    שילוב של בינה מלאכותית עם מיחשוב קוונטי הוא אפילו מרגש ומפחיד יותר.
    השילוב הזה ייצור בינה מלאכותית שמשתפרת באופן דרמטי כל חלקיק שנייה.
    דרך אגב, כבר עכשיו אני רואה איך בינה מלאכותית עוזרת לי אישית לתכנת
    בשפות מחשב כמו Java, c++, python, react, assemby
    זה נחמד ועוזר לעבוד מהר יותר אבל מצד שני, כבר היום אנשים עם ידע בסיסי
    בלבד בתיכנות יכולים לבקש מבינה מלאכותית לכתוב להם קוד לפי דרישות שלהם.
    נדמה לי שאפשר לקרוא לזה תיכנות דור חמישי (למי שמכיר את הדורות הקודמים).

    אלי איזק

    מורה פרטי למדעי המחשב, מרצה עד לתואר שני ומהנדס תוכנה בכיר

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.