סיקור מקיף

הקוד הגנטי מכיל הרבה ‘מילים’ נרדפות – תורת האינפורמציה עשויה לעזור להסביר את העודפויות

מחקר חדש מצביע על כך שייתכן שיש שני גורמים משמעותיים נוספים שמערכות טבעיות שוקלות: המהות המידעית-תאורטית של הקוד הגנטי ועקרון האנטרופיה המקסימלית

מאת: סובהאש קאק, פרופסור להנדסת חשמל ומחשבים, אוניברסיטת אוקלהומה

הקוד הגנטי ב-DNA. <a href="https://depositphotos.com. ">המחשה: depositphotos.com</a>
הקוד הגנטי ב-DNA. המחשה: depositphotos.com

כמעט כל החיים, מחיידקים ועד בני אדם, משתמשים באותו קוד גנטי. קוד זה פועל כמילון, מתרגם גנים לחומצות אמינו שמשמשות לבניית חלבונים. אוניברסליות הקוד הגנטי מצביעה על אב קדמון משותף בין כל היצורים החיים ועל התפקיד החיוני שקוד זה ממלא במבנה, תפקוד וויסות תאים ביולוגיים.

הבנת אופן פעולת הקוד הגנטי היא היסוד של הנדסה גנטית וביולוגיה סינתטית. אבל ישנן עדיין תעלומות רבות, כגון מדוע הקוד חשוב לתהליכים ביולוגיים שונים כמו קיפול חלבונים.

כחוקר העובד בממשק שבין ביולוגיה לפיזיקה, אני מיישם תורת אינפורמציה – המתמטיקה של איך אינפורמציה נשמרת ומתקשרת – כדי לחקור חלק משאלות מעניינות אלה. בדיוק כשם שמחשבים זקוקים למחרוזות של קוד בינארי כדי לתפקד, גם תהליכים ביולוגיים מסתמכים על פיסות אינפורמציה.

במחקרי האחרון, אני מציע שתורת האופטימיזציה עשויה לספק הסבר פוטנציאלי לתעלומה ותיקה על יתירות מסוימת באופן שבו חומצות אמינו מקודדות.

מילים נרדפות

ספר הקוד הגנטי מורכב מ”מילים” המורכבות מארבע אותיות: A, C, G ו-U. כל אחת מאותיות אלה מייצגת אבן בניין כימית שונה הנקראת נוקלאוטיד: אדנין, ציטוזין, גואנין ואורציל. מכונה מולקולרית הנקראת ריבוזום קוראת את ספר הקוד כדי לתרגם גנים לחלבונים.

הריבוזום קורא מילים בנות שלוש אותיות הנקראות קודונים, ויש 64 צירופים אפשריים שונים של ארבע האותיות שיוצרים קודונים שונים. ברשימה הזאת של 64 מילים, 61 מקודדות חומצות אמינו, ו-3 אותות לריבוזום להפסיק את סינתזת החלבון בתא. לדוגמה, ‎”AUG”‎ מקודד את חומצת האמינו מתיונין וגם מציין את תחילתו של חלבון.

אבל בדיוק כמו בכל שפה אחרת, ישנם ביטויים נרדפים – קודונים שונים יכולים לקודד את אותה חומצת אמינו. למעשה, מכיוון שיש רק 20 חומצות אמינו אבל 61 מילים שונות לקודד אותן, יש הרבה חפיפה. חומצת אמינו יכולה להיות מקודדת על ידי בין אחת לשש מילים שונות. יש רק שתי חומצות אמינו שיש להן קודון יחיד, מתיונין וטריפטופן. עודפות זו עוזרת לריבוזומים לבצע את משימותיהם בצורה נכונה גם כאשר יש טעות כתיב בקוד הגנטי.

הנדסת קווים מנחים של הטבע

מדוע לחומצות אמינו מסוימות יש יותר ביטויים נרדפים מאחרות היא תעלומה שמטרידה מדענים במשך עשורים. האם יש תבנית לשוני הזה, או שזה אקראי? כדי לענות על השאלה הזו, מדענים חוקרים את הכללים שמנחים את קבלת ההחלטות של הטבע.

אילו מהנדס אנושי היה מעצב את הקוד הגנטי, הוא היה רוצה לוודא שלכל חומצת אמינו יש דרגת עודפות דומה כדי להגן מפני טעויות ולקדם אחידות. ההתאמה של 61 הקודים ל-20 חומצות האמינו הייתה שווה בקירוב, עם הקצאת שלושה קודונים לכל חומצת אמינו.

אבל לטבע יש סדרי עדיפויות אחרים. מודלים אבולוציוניים של מערכות טבעיות כמו חיידקים מדגימים שהטבע תמיד שואף לאופטימיזציה. לא רק הצורה הסופית של חלבון צריכה להיות אופטימלית, אלא גם הצורות הביניים שלו. אופטימיזציה מבטיחה שמערכות טבעיות יכולות להסתגל לסביבות שונות.

מדענים מבינים חלק מהקווים המנחים שהטבע הולך לפיהם כאשר הוא מעצב את הקוד הגנטי. לדוגמה, הסידור המרחבי של אטומים ומולקולות בתוך וסביב לקוד הגנטי יכול להשפיע על תפקודו, כמו גם הקו-אבולוציה של מבנים תאיים אחרים המעורבים ביצירת חלבונים.

תורת האינפורמציה וגנטיקה

המחקר שלי מצביע על כך שייתכן שיש שני גורמים משמעותיים נוספים שמערכות טבעיות שוקלות: המהות המידעית-תאורטית של הקוד הגנטי ועקרון האנטרופיה המקסימלית.

בדומה לאופן שבו המחשב מעבד נתונים המורכבים מ-0 ו-1, החיים מעבדים את הקוד הגנטי על בסיס נתונים המורכבים מארבע האותיות A, C, G ו-U. מתמטית, עם זאת, הדרך הכי יעילה אנרגטית לייצג נתונים אינה בינארית (או בסיס 2) – באמצעות 0 ו-1, כפי שמחשבים עושים – אלא בסיס e. קיצור של מספר אוילר, e הוא מספר אי-רציונלי – זה אומר שאין דרך לרשום את הערך המדויק שלו באמצעות שברים או עשרוניים (למרות שהוא מתקרב ל-2.718).

המושכות של הטבע לאופטימיזציה באמצעות מספר אי-רציונלי זה אחראית לפרקטלים החוזרים אינסוף פעמים הנראים בקווי חוף משוננים, עלי קשתות, פתיתי שלג ועצים. מעבר לביולוגיה, אופטימיזציית מידע באמצעות e גם יש לה יישומים במתמטיקה ובקוסמולוגיה.

עיקרון נוסף הפועל בעולם הטבעי הוא זה של אנטרופיה מקסימלית. אנטרופיה היא מדד לאי-סדר במערכת, ועקרון האנטרופיה המקסימלית קובע שמערכות מתפתחות למצבים של אי-סדר גובר. עיקרון זה מאפשר לחוקרים להסיק מסקנות מנתונים מוגבלים ושימש להסבר איך חומצות אמינו מתקשרות בחלבונים.

בהקשר של קבוצות קודונים, עקרון האנטרופיה המקסימלית מרמז שהטבע מבלבל נתונים ככל האפשר – זה אומר שהפונקציה שמתארת את חלוקת קבוצות הקודונים צריכה להיות מסובכת מתמטית לבטל. לימוד איך למקסם את המורכבות המתמטית של פונקציה זו חושף תבניות פוטנציאליות העומדות בבסיס קבוצות הקודונים.

אני מאמין ששני העקרונות הללו עשויים לעזור לתאר את חלוקת קבוצות הקודונים בקוד הגנטי ולהצביע על השימושיות של מתמטיקה בניתוח מערכות טבעיות. למרות שישנן תעלומות ביולוגיות רבות שמדענים טרם פתרו, תורת האינפורמציה יכולה להיות כלי חזק לעזור לפענח את הקוד הגנטי.

למאמר ב-THE CONVERSATION

עוד בנושא באתר הידען:

5 תגובות

  1. שאלה:
    האם אפשר להוכיח שהקודונים חייבים להיות בשלשות, ולא ברביעיות למשל?

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.