מאגר נתונים רחב, עשיר ומבוסס ניסויים, מאפשר למודלים לחפש דפוסים ולהציע מועמדים חדשים במהירות. התוצאה היא מאגר מקוון שנבנה בעזרת מודלי שפה גדולים, שקראו וחילצו נתונים מתוך מאגר עצום של ספרות מדעית.
מגנטים חזקים נמצאים כמעט בכל מקום. במנועים של רכבים חשמליים, בגנרטורים של טורבינות רוח, ברמקולים, בחיישנים ובמערכות תעשייתיות. הבעיה היא שמגנטים מתקדמים רבים נשענים על יסודות נדירים. זה יוצר תלות בשרשראות אספקה מוגבלות, ומוסיף אי־ודאות למחירים ולזמינות. לכן חומרים מגנטיים “חלופיים”, שמספקים ביצועים טובים ללא תלות גבוהה ביסודות נדירים, הפכו ליעד מרכזי במחקר.
המחקר החדש מציע גישה אחרת למציאת חומרים כאלה. במקום להתחיל ממספר קטן של מועמדים ולבדוק אותם במעבדה, החוקרים בנו קודם את התשתית: מאגר נתונים רחב, עשיר ומבוסס ניסויים, שמאפשר למודלים לחפש דפוסים ולהציע מועמדים חדשים במהירות. התוצאה היא מאגר מקוון שנבנה בעזרת מודלים שפתיים גדולים, שקראו וחילצו נתונים מתוך מאגר עצום של ספרות מדעית.
מאגר מבוסס ניסויים, לא רק חישובים
המאגר כולל 67,573 רשומות של חומרים מגנטיים. כל רשומה מאורגנת סביב זהות חומרית ברורה, כלומר הרכב כימי, מידע מבני ותכונות מגנטיות. לכל חומר נשמרים גם שדות רבים שנועדו להקל על למידת מכונה. בין היתר נכללים פרטים על טמפרטורות מעבר, כמו טמפרטורת קירי או טמפרטורת נֵאל, וכן פרמטרים נוספים שחשובים להבנת התנהגות מגנטית.
החוקרים מדגישים שהערך של המאגר הוא בכך שהוא מבוסס על נתונים ניסויים שדווחו במאמרים, ולא רק על תחזיות חישוביות. בתחום החומרים, זה הבדל קריטי. לעיתים חישובים מזהים מגנט “מבטיח”, אך כאשר מגיעים למעבדה מתגלות בעיות של יציבות, זיהומים, או שלבי התגבשות שונים. מאגר שנשען על תוצאות ניסוייות מספק נקודת פתיחה טובה יותר.
כדי לבנות אותו, החוקרים אספו היקף גדול של מאמרים ניסויים, פירקו אותם למקטעי טקסט, והשתמשו במודלים שפתיים כדי לחלץ מהם שדות ספציפיים. זהו תהליך מורכב, משום שהמידע אינו מופיע תמיד באותה תבנית. לפעמים הנתונים נמצאים בטבלאות, לפעמים בטקסט רציף, ולעיתים צריך לזהות הקשר בין חומר מסוים לבין מדידה שנעשתה עליו בתנאים מסוימים. כאן נכנסת עוצמת המודלים: הם יכולים לבצע חילוץ שיטתי בקנה מידה גדול, שאינו אפשרי בעבודה ידנית.
מה עשו עם המאגר, ומהי המשמעות לתעשייה?
לאחר שהמאגר הוקם, החוקרים אימנו עליו מודלים שמסווגים חומרים ומעריכים תכונות, ואז הפעילו את המודלים על מאגרים חיצוניים כדי לחפש מועמדים חדשים. הם דיווחו על קבוצה של חומרים שהמודלים מזהים כבעלי פוטנציאל להיות מגנטיים גם בטמפרטורות גבוהות. בדגש על טמפרטורות מעל 500 קלווין, כלומר מעל כ־227 מעלות צלזיוס.
כאן חשוב לשים סייג. מגנט “טוב” לתעשייה אינו רק חומר עם טמפרטורת מעבר גבוהה. צריך גם תכונות כמו קוארסיביות, מגנטיזציה, יציבות תרמית ומכנית, והיכולת לייצר את החומר בצורה תעשייתית ובעלות סבירה. המאגר אינו מחליף ניסוי. הוא אמור לקצר את הדרך אל הניסוי, ולמנוע בזבוז זמן על כיוונים חלשים.
החשיבות המעשית היא ביצירת “מסלול מהיר”. כאשר יש מאגר ניסויי גדול, אפשר להפעיל עליו מודלים, לקבל רשימות מועמדים, ולכוון אליהם מעבדות שמסוגלות לסנתז ולמדוד. כך מחקר בסיסי יכול להתחבר מהר יותר לצרכים של תעשיות כמו רכב חשמלי ואנרגיה מתחדשת. אם הגישה תתרחב גם לתחומים אחרים, היא יכולה לשנות את הדרך שבה מחפשים חומרים פונקציונליים בכלל, לא רק מגנטיים.
למאמר המדעי (Nature Communications)
עוד בנושא באתר הידען: