סיקור מקיף

פייסבוק של מולקולות

מדענים מהמכון הלאומי לתקנים ולטכנולוגיה (NIST) בארה”ב פיתחו רשתות של נתונים מולקולאריים שבדומה לפייסבוק ניתן לבצע בתוכן חיפושים מבוססי נתונים וגרפים. לסרוק כמות אדירה של נתונים כימיים וביולוגיים על מנת למצוא חומרים בעלי תכונות מבוקשות. לדוגמה – חומרים בעלי חמש טבעות שיש להם זיקה לאנזים מסוים

רשת של מולקולות. איור: shutterstock
רשת של מולקולות. איור: shutterstock

הרשת החברתית התרחבה והגיעה ליעד חדש ומפתיע: מולקולות. מדענים מהמכון הלאומי לתקנים ולטכנולוגיה (NIST) בארה”ב פיתחו רשתות של נתונים מולקולאריים שבדומה לפייסבוק ניתן לבצע בתוכן חיפושים מבוססי נתונים וגרפים. בעוד שחיפוש גרפי בפייסבוק יאפשר למשתמשים למצוא את כל עמיתיהם בעיר ניו-יורק, למשל, האוהבים לשתות בירה באמצעות חיפוש מהיר, הרשתות שפותחו ע”י המדענים תוכלנה לסייע לחוקרים לסרוק כמות אדירה של נתונים כימיים וביולוגיים על מנת למצוא חומרים בעלי תכונות מבוקשות. לדוגמה – חומרים בעלי חמש טבעות שיש להם זיקה לאנזים א’. גישת חיפוש זו תוכל להאיץ את פיתוחם של תרופות חדשות וחומרים רצויים אחרים.

למולקולות אין פרופיל פרטני ברשת, בדומה למשתמשי הפייסבוק, כך שהאתגר הראשון של החוקרים היה לפתח שפה משותפת למדענים באמצעותה הם יוכלו לתאר את מושאי מחקריהם. לדוגמה, קבוצת מחקר אחת עשויה לתאר את תכונותיו של החומר בתור “זגוגי”, בעוד שקבוצה אחרת עשויה להשתמש דווקא בהגדרה “זכוכיתי”, וזאת למרות ששתי ההגדרות הן בעלות אותה משמעות, מסבירה אחת מהשותפות למחקר.

אחת מהגישות האפשריות לפתרון סוגיה זו יכולה להיות הגדרת אוסף מונחים תקניים, אולם החוקרים העדיפו גישה גמישה יותר שתוכל להתפתח במרוצת הזמן. שפת החיפוש שהחוקרים הגו דומה לשפות הודו-אירופיות, כגון סנסקריט ולטינית, בהן עושים שימוש בשורשים קצרים לשם בניית מילים תוך הסתמכות על אוסף חוקים. אחד מהחוקרים נותן כדוגמה את המילה “יוגה” בסנקסקריט המבוססת על השורשים “י” שמשמעותו לחבר, “ו” שמשמעותו הבורא (אלוהים) או המוח, ו- “גה”, שמשמעותו תנועה. בדומה לכך, מדענים יוכלו לקחת שלוש מילות שורש פשוטות “אדום”, “לייזר” ו- “אור” ולשלב אותן לתיאור מילה עבור תרכובת מוגדרת בשם “אור-לייזר-אדום” המבטאת רעיון חדש. השימוש בשורש ובכללי השפה משמעותו כי מדענים המכירים את מילות השורש יוכלו להבין את המשמעות של מונחים בלתי מוכרים. בנוסף, שפה זו מאפשרת למדענים גמישות בפיתוח קל של מונחים חדשים בלתי-תקניים בעתיד לבוא.

צוות החוקרים כבר יישם את כללי המילון החדש שלו עבור המבנים הכימיים הקיימים במסד-הנתונים המדעי בשם PubChem, מאגר נתונים אדיר-ממדים של מיליוני תרכובות וחומרים כימיים, במאגר הנתונים העולמי לחלבונים (PDB) ובמאגרי נתונים הנמצאים בשימוש המכון עצמו. למרות שמסדי הנתונים המדעיים עדיין לא הגיעו לנפח הפעילות של פייסבוק של יותר ממיליארד משתמשים, נעשה בהם שימוש פעיל ע”י מדענים רבים בתוך המכון וגם מחוצה לו.

מרגע שנקבע המילון הראשוני בשפה זו, החוקרים פעלו גם לתייג את התיאורים של המולקולות והניסויים המדעיים בצורה מידרגית שתאפשר למדענים להגיע לתוצאות הן מקיפות והן מדויקות. בעיה מוכרת הקיימת בשיטות חיפוש רבות היא קבלת תוצאות רבות מדי, מציין החוקר הראשי. החוקר מתאר את הגישה של צוות המחקר שלו כדומה לאתגר של מציאת שקית תפוצ’יפס בחנות כולבו גדולה – ראשית אתה מוצא את החנות המתאימה, בשלב השני של המידרוג אתה מוצא את מתחם החטיפים, שם את אזור הטוגנים ומשם אתה תדע עד מהרה אם יש בכלל תפוצ’יפס או לא,” מסביר החוקר הראשי. “כך, שאפילו אם יש בחנות מיליוני פריטים, אתה יכול לדעת די מהר אם הם מוכרים תפוצ’יפס או לא.” צוות החוקרים טוען כי שיטת המידרוג שלהם תוכל לסייע גם למדענים הצריכים למצוא מילות מפתח שתשמשנה אותם במאמרי המחקר שלהם.

ארגון כמויות המידע הכבירות המיוצרות בתחום המדע מהווה אתגר גדול, מסביר החוקר, אולם לכמויות אלו ייתכנו תועלות רבות. חיפושים גרפיים יעילים יוכלו לאפשר למדענים לאתר במהירות מבנים כימיים ותכונות פיזיקליות הנדרשים להם לשם פיתוח תרופות חדשות או חומרים מתקדמים.

הידיעה על המחקר

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.