סיקור מקיף

על עכברים ואנשים

המצאתם של שבבי ה- DNA הביאה למהפיכה ביכולתם של חוקרים לנתח שינויים בגנים. אלא שצוות חוקרים ממכון סאלק, שהתכוון ליצור מפה מולקולרית של מוח העכבר, נתקל בבעיה: כמות המידע שנאספה היתה גדולה בהרבה מזו שיכלו לנהל ולנתח באמצעים שהיו באותה עת במעבדות מכון המחקר.

מיכה רוזן

קישור ישיר לדף זה: https://www.hayadan.org.il/micencr.html

ד”ר קארולי בארלו, אוהבת עכברים. היא מוקפת בהם יום יום שעה שעה, במסגרת עבודתה במכון סאלק, אחד המוסדות הרפואיים המחקריים הידועים יותר בעולם. לדברי ד”ר בארלו, המתמחה בניתוח מולקולרי של הפרעות הקשורות בפעילות המוח האנושי, השימוש בעכברים דווקא, נובע מכך שלחוקרים מסוגה קל לזהות ולבצע שינויים בגנים הזהים אצל עכברים ואצל בני אדם. “מבחינה גנטית, ובמידה מסויימת גם פיזיולוגית אנו לא כל כך שונים מהעכבר המצוי. אני יכולה לזהות מוטציה גנטית אצל אדם, ליצור מוטציה זהה אצל עכבר, ל'הנדס' מאותו עכבר קבוצה שלמה של עכברים בעלי אותה מוטציה ומשם פתוחה הדרך לניתוח ולמחקר”. כדי ליישם את מחקריה מבצעת ד”ר בארלו ניתוחים המתבססים על הרצף של 3 מיליארד הקשרים הכימיים המרכיבים את ה- DNA האנושי. וזה הרבה חישובים.

עד לא מכבר היו ד”ר בארלו וחבריה למקצוע מוגבלים בגלל כמות המידע אותו יכלו לעבד ולייצר. המצב השתנה עם כניסתם לתמונה של שבבי ה- DNA, המורכבים משילובי חומצות גרעין והמאפשרים לבדוק בדיוק רב את הפעילות הכרוכה בגן בודד. לפני עידן שבבי ה- DNA ניתן היה לבצע את הניתוח, אלא שהוא היה מוגבל לגן אחד בכל פעם. כיום ניתן לנתח 12000 גנים בבת אחת. החלון המחקרי שנפתח בפני ד”ר בארלו וחבריה, הוביל אותה לנסיון ליצירת מפה מולקולרית של מוח העכבר. למחקר הצטרפו ד”ר דיויד לוקהארט, חוקר מוביל בתחום הגנומיקה ומתיו זאפאלה. המטרה המשותפת: לאסוף את כל הנתונים בפורמט של מסד נתונים בו תוכל להשתמש כל קהיליית המדע. וכאן נתקל הצוות בבעיה: כמות המידע שנאספה היתה גדולה בהרבה מזו שיכלו לנהל ולנתח באמצעים שהיו באותה עת במעבדות מכון המחקר.

הפתרון נמצא במהרה בדמות מחסן נתונים ארגוני, כאשר המשימה היתה ליצור פלטפורמה שבאמצעותה ניתן לא רק לאחסן מידע אלא גם ובעיקר כזו שתאפשר לחוקרים ל'הריץ' אלגוריתמים בתוך מסד הנתונים עצמו.

לא מעט ארגונים ועסקים גדולים ברחבי העולם מיישמים אצלם מערכות מחסני נתונים (DataWarehouse). מחסן נתונים הינו מאגר גדול במיוחד, של סוגים שונים של נתונים מפורטים, המצויים בידי הארגון, שנאספו על-ידי הארגון תוך כדי עבודתו השוטפת, במשך תקופה. איסוף הנתונים נעשה במסגרת המערכות התיפעוליות הרגילות של הארגון. הנתונים הנאספים מועברים באופן שוטף אל מחסן הנתונים (שילוב של חומרה רבת עוצמה ותוכנה ייעודית) ונאגרים שם בצורתם הפרטנית, היינו: לא בצורה מסוכמת, וזאת על מנת שלא לאבד מידע. במחסן נתונים הבנוי בטכנולוגיה מתאימה, ערוכים הנתונים הללו באופן המשקף את המציאות בצורה אמיתית והמאפשר לנתח אותם במהירות – גם כשכמות הנתונים שבמחסן גדולה מאוד. אפשרות זו של טיפול בכמויות גדולות של נתונים מפורטים היא בעלת חשיבות רבה, שכן ככל שהניתוח נעשה על כמות גדולה יותר של נתונים מפורטים, כן גדלה מהימנותן של תוצאות הניתוח. בשל אופיה של עבודת ניתוח כזו, על מחסן הנתונים גם להיות בנוי בטכנולוגיה המאפשרת הפעלת שאילתות שאינן רק כאלה המתוכננות מראש, היינו: לפני תחילת ניתוח הנתונים. בהחלט ייתכנו מצבים בהם יוביל שלב כלשהו משלבי הניתוח למסקנה כי יש להמשיך את הניתוח על-ידי שאילתא שלא נצפתה מראש – אלא רק לאחר התבוננות בתוצאות שלב קודם יותר של הניתוח.

לאחר שבחנה מספר ספקי פתרונות ונתקלה בהרמות גבה ובמידה רבה של ספקנות באשר ליכולת להתמודד עם הפרוייקט הגיעה ד”ר בארלו ל- Teradata, חטיבת מחסני הנתונים של NCR. למשימה נבחר מחסן נתונים בהיקף של כטרה-בייט היכול להכיל את כל הנתונים על מוחו של העכבר. “היתרונות בשימוש במחסן נתונים היכול לבצע עיבוד מקבילי ברמה גבוהה, היו מיידיים”, אומרת ד”ר בארלו. “ברוב המקרים השאילתות שמפנים חוקרים הן שאילתות אד-הוק, שכן הם בוחנים את הנתונים במהלך 'מצוד' אחר גנים הגורמים או מונעים מחלות מסויימות. לא תמיד יודעים את השאלות מראש. זאת ועוד, השימוש ב- Teradata איפשר לחוקרים לבצע שימוש שוטף בכל הנתונים שנאספו בניסויים הגנומיים, אשר לעתים באו לידי ביטוי בכ- 400000 מדידות שונות, אשר אותן יש לעתים להשוות עם מדידות מניסויים אחרים”.

“השימוש במחסן הנתונים הקפיץ את צוות החוקרים מספר מדרגות קדימה”, אומר ד”ר לוקהארט. “כעת אנו יכולים להבחין בשינויים בגנים בין רקמות בריאות וחולות. החוקרים שלנו מבלים כיום 3 שעות מול המחשב במקום 3 חודשים, כפי שהיה קודם לכן. השימוש במחסן הנתונים, יכול להשפיע על חייהם של מיליונים ברחבי העולם והסיפור כיצד זה מוסד מחקר גנטי החל לעשות שימוש בפלטפורמה, אשר בדרך כלל מזוהה עם ניתוחים עסקיים, מרתק”.

* הכותב הוא מנהל לקוחות נבחרים ומומחה לתחומי מחסני נתונים בחברת י.א. מיטווך ובניו, נציגת NCR

לידיעה באתר טרה-דטה

https://www.hayadan.org.il/BuildaGate4/general2/data_card.php?Cat=~~~387452073~~~48&SiteName=hayadan

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.