למה בני אדם לא מדברים כמו מחשבים: מדענים מצאו תשובה

מחקר חדש מציע שהשפה האנושית פחות “דחוסה” מקוד דיגיטלי, אבל חוסכת למוח מאמץ בעזרת דפוסים מוכרים וניבוי

השפה האנושית עשויה להיראות לא יעילה לעומת קודים דיגיטליים, אבל המבנה שלה מותאם עמוק לאופן שבו המוח פועל. <a href="https://depositphotos.com. ">המחשה: depositphotos.com</a>
השפה האנושית עשויה להיראות לא יעילה לעומת קודים דיגיטליים, אבל המבנה שלה מותאם עמוק לאופן שבו המוח פועל. המחשה: depositphotos.com

השפות האנושיות הן מערכות מורכבות במיוחד. בעולם מדובר בכ־7,000 שפות — מחלקן נותרו רק מעט דוברים, ואחרות, כמו סינית, אנגלית, ספרדית והינדי, מדוברות בידי מיליארדי אנשים.

למרות ההבדלים הרבים ביניהן, לכל השפות תפקיד בסיסי דומה: הן מעבירות משמעות באמצעות צירוף מילים לביטויים, ולאחר מכן ארגון הביטויים למשפטים. לכל “רמה” יש משמעות משלה, וביחד הן מאפשרות לבני אדם לשתף רעיונות באופן שניתן להבין בבירור.

למה השפה אינה דחוסה כמו קוד דיגיטלי

“זהו למעשה מבנה מורכב מאוד. מאחר שהעולם הטבעי נוטה למקסם יעילות ולחסוך במשאבים, הגיוני לשאול מדוע המוח מקודד מידע לשוני בצורה שנראית מסובכת כל כך, במקום לקודד אותו בצורה דיגיטלית, כמו מחשב”, מסביר מיכאל האן (Michael Hahn).

האן, פרופסור לבלשנות חישובית באוניברסיטת זארלנד, חקר את השאלה הזאת יחד עם עמיתו ריצ’רד פוטרל (Richard Futrell) מאוניברסיטת קליפורניה באירווין. לכאורה, אם היינו מקודדים מידע כרצף בינארי פשוט של 0 ו־1, אפשר היה “לדחוס” אותו ביעילות רבה יותר מאשר בשפה טבעית. מכאן עולה שאלה מתבקשת: למה בני אדם אינם מתקשרים, באופן מטאפורי, כמו R2-D2 מ”מלחמת הכוכבים”, אלא מסתמכים על שפה מדוברת? האן ופוטרל מציעים כעת תשובה.

דפוסים מוכרים מקלים על המוח

“השפה האנושית מעוצבת לפי מציאות החיים סביבנו”, אומר האן. “אם, למשל, אדבר על חצי חתול וחצי כלב ואכנה את זה במונח מופשט כמו ‘גול’, אף אחד לא יבין למה אני מתכוון — כמעט בוודאות כי אף אחד לא ראה ‘גול’. זה פשוט לא משקף ניסיון חיים של אדם כלשהו”. באותה מידה, הוא מוסיף, אין היגיון ב”ערבוב” המילים “חתול” ו”כלב” למחרוזת אותיות שיש בה אותן אותיות אבל אי אפשר לפרש אותה. רצף כמו “gadcot” חסר משמעות עבורנו, גם אם הוא מורכב מאותיות משתי המילים. לעומת זאת, הצירוף “חתול וכלב” מובן מייד, מפני ששתי המילים מתייחסות לבעלי חיים מוכרים שרוב האנשים מזהים.

האן מסכם את הממצא המרכזי כך: “בפשטות, קל יותר למוח שלנו לבחור בדרך שנראית מסובכת יותר”.

כלומר, גם אם המידע אינו “דחוס” לצורה הקצרה ביותר, העומס החישובי על המוח קטן בהרבה, משום שהמוח מעבד שפה תוך אינטראקציה מתמדת עם סביבה טבעית מוכרת. קוד בינארי “טהור” עשוי להיראות יעיל יותר, מפני שאפשר להעביר אותו בזמן קצר יותר, אבל הוא מנותק מהניסיון שלנו בעולם.

האן מציע אנלוגיה יומיומית: הנסיעה הרגילה לעבודה. “במסלול הקבוע שלנו הדרך מוכרת עד כדי כך שהנהיגה כמעט אוטומטית. המוח יודע בדיוק למה לצפות, ולכן המאמץ קטן. מסלול קצר יותר אך לא מוכר מרגיש מתיש יותר, מפני שהוא מחייב אותנו להיות קשובים הרבה יותר לאורך הדרך”. מבחינה מתמטית, הוא טוען, “מספר ה’ביטים’ שהמוח צריך לעבד קטן בהרבה כשאנחנו מדברים בדרכים טבעיות ומוכרות”.

ניבוי מצמצם אי־ודאות במשפטים

קידוד ופענוח של מידע בצורה דיגיטלית היו, לפי החוקרים, דורשים מאמץ קוגניטיבי גדול יותר הן מן הדובר והן מן המאזין. במקום זאת, המוח האנושי מחשב ללא הרף את ההסתברויות של הופעת מילים וביטויים ברצף, ולאחר שימוש יום־יומי בשפת האם במשך עשרות אלפי ימים לאורך החיים, דפוסי הרצפים הללו נטמעים עמוק ומפחיתים עוד יותר את העומס החישובי.

האן נותן דוגמה מגרמנית: כאשר דובר אומר “Die fünf grünen Autos” (“חמש המכוניות הירוקות”), הביטוי יהיה כמעט תמיד מובן לדובר גרמנית אחר; לעומת זאת “Grünen fünf die Autos” (“ירוקות חמש המכוניות”) לא יישמע תקין, ולכן גם לא ייבנה ממנו פירוש טבעי.

כשהמאזין שומע “Die”, הוא כבר יודע שהמילה הזו מסמנת בדרך כלל שם עצם נקבה ביחיד או שם עצם ברבים (בכל מין דקדוקי). כך המוח “פוסל” מיד אפשרויות של זכר או נייטרלי ביחיד. המילה הבאה, “fünf” (“חמש”), מרמזת שמדובר במשהו שניתן לספירה, ולכן מוציאה מן החשבון מושגים שאינם בני־מנייה כמו “אהבה” או “צמא”. לאחר מכן “grünen” (“ירוקות/ירוקים”) מוסיפה שהשם שיבוא יהיה ברבים ושמדובר בדבר ירוק — ייתכן מכוניות, אבל באותה מידה בננות או צפרדעים. רק עם המילה האחרונה “Autos” (“מכוניות”) נפתרת העמימות שנותרה. ככל שהביטוי מתקדם, מספר האפשרויות הפרשניות מצטמצם, עד שלרוב נותר פירוש אחד.

לעומת זאת, בביטוי הלא תקין “Grünen fünf die Autos” שרשרת הרמזים והניבויים נשברת: סדר הסימנים הצפוי מופר, והמוח מתקשה לבנות משמעות מן האמירה.

מה זה אומר על בינה מלאכותית

האן ופוטרל הדגימו את הקשרים הללו באופן מתמטי, והמחקר פורסם בכתב העת Nature Human Behaviour. לפי החוקרים, הממצאים עשויים להיות שימושיים גם לפיתוח עתידי של מודלי שפה גדולים (LLMs) שעליהם נשענות מערכות בינה מלאכותית יוצרת, כגון ChatGPT או Copilot של מיקרוסופט.

מקור מדעי: “Linguistic structure from a bottleneck on sequential information processing”, Richard Futrell & Michael Hahn, ‏24-11-2025, Nature Human Behaviour.
DOI: 10.1038/s41562-025-02336-w

עוד בנושא באתר הידען:

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זו עושה שימוש ב-Akismet כדי לסנן תגובות זבל. פרטים נוספים אודות איך המידע מהתגובה שלך יעובד.