מרוץ החימוש של הבינה המלאכותית: למה אנתרופיק מבקשת ללחוץ על הברקס

מסמך חדש של Anthropic מציג זינוק חד ביכולות של Claude בכתיבת קוד, תיקון מערכות ופיתוח מחקרי — ומעלה מחדש את השאלה האם האנושות תוכל להאט בזמן את קצב ההתקדמות של מערכות AI מתקדמות

בינה מלאכותית אמינה? איור: ד"ר רועי צזנה באמצעות ג'מיני
בינה מלאכותית אמינה? איור: ד"ר רועי צזנה באמצעות ג'מיני

אנתרופיק פרסמה בשבוע האחרון מסמך עם כמה תחזיות שצריכות להדאיג – ולשמח – את כולנו. התחזית הפחות-קיצונית שלהם היא שעד סוף השנה, בינה מלאכותית תוכל לכתוב קוד טוב יותר ממפתח תוכנה אנושי. 

התחזית הזו בפני עצמה היא שינוי דרמטי עבור המתכנתים, שיראו חלק גדול מנפח העבודה שלהם עובר לבינה המלאכותית. יש לה גם משמעות גדולה עבור כל יתר בני-האדם הפשוטים שלא יודעים לתכנת, מכיוון שלכל אחד מאיתנו יהיה "גאון אישי" שיוכל לפתח עבורו כל אפליקציה שירצה.

אבל זו התחזית הפחות-קיצונית.

הבשורה האמיתית שאנתרופיק הודיעה עליה, היא שאם המגמות הטכנולוגיות ימשיכו להתקדם באותו קצב, הרי שסביר שמערכות הבינה המלאכותית יוכלו לתכנן, לעצב ולשפר את עצמן – והן יעשו זאת מהר יותר וטוב יותר מכל אדם שהיה עובד על אותן מערכות.

כדי להבין למה אנתרופיק חושבים שזה מה שיקרה, אנחנו צריכים קודם לעבור על הראיות שהיא מביאה מהשטח – כלומר, מהדרכים בהן המהנדסים של אנתרופיק משתמשים בעצמם בבינה המלאכותית.


נכון למאי 2026, קלוד כתב יותר משמונים אחוזים מהקוד שמצא את דרכו לתוך המוצרים של אנתרופיק. כדי שתקבלו פרופורציות: בתחילת 2025, שיעור הקוד שנכתב על-ידי קלוד היה באזור החמישה אחוזים בלבד.

כמובן, קלוד מקבל הנחיה בלתי-פוסקת מהמהנדסים וממפתחי התוכנה שמפעילים אותו. אבל אם הם עובדים נכון, הוא מעצים את היכולות שלהם. המהנדס הממוצע באנתרופיק מפיק כיום פי שמונה יותר קוד מדי יום, בהשוואה לתפוקה שלו לפני שנתיים בלבד. העבודה של אותו מהנדס הפכה למלאכת ניהול: הוא מכוון את הבינה המלאכותית ובוחן את התוצרים שלה, במקום שיצטרך לכתוב את הקוד בעצמו.

"אנחנו לא מתגמלים אנשים לפי מספר שורות הקוד שכתבו." מבהירים באנתרופיק, "אבל חברי הצוות מפיקים יותר קוד פשוט כי הם משתמשים במערכות בינה מלאכותית."

לפי סקר פנימי שנערך על צוותי המחקר בחברה, המהנדסים טוענים שהם מגיעים לתפוקה גדולה פי ארבעה מכפי שהיו יכולים לעשות בלי שימוש בבינה מלאכותית. בהחלט ייתכן שהם צודקים.

"באפריל 2026, קלוד השיק יותר מ- 800 תיקוני קוד, שהפחיתו שגיאות API פי אלף." כתבו במסמך. "המהנדס שהפעיל את קלוד העריך שהיה צורך בארבע שנות עבודה אנושית כדי להשלים את המטלה."


כבר לפני שנה קלוד ידע לכתוב קוד ברמה גבוהה… אבל רק לבעיות 'טריוויאליות' ופשוטות. בעיות מורכבות יותר, ובמיוחד בעיות פתוחות שדורשות חשיבה יצירתית, יכולת תכנון מראש והבנה רחבה יותר של התחום, נשארו הרחק מאחור. בסוף 2025, קלוד הגיע לעשרים אחוזי הצלחה בלבד בפתרון בעיות מורכבות שכאלו.

אבל זה היה לפני חצי שנה.

בששת החודשים האחרונים אפשר לראות זינוק מטאורי ביכולות של קלוד לפתור בעיות פתוחות. למעשה, השיפור ביכולות הוא מהסוג שהיינו מצפים לראות לאורך עשור או שניים. כיום, בתחילת יוני 2026, קלוד כבר הגיע לרמת דיוק של 76 אחוזים בפתרון בעיות מורכבות שרק מהנדס אנושי היה יכול להתמודד איתן בעקביות בעבר.

איך זה נראה בפרקטיקה?

"שדרוג שגרתי של המערכת החל לגרום לעשרות-אלפי עבודות אימון לקרוס." מביאים באנתרופיק דוגמא מהשטח. "מהנדס הכווין את קלוד לאירוע בזמן-אמת… קלוד עבר על העבודות הרצות ובחן סביבות הרצה אחת בכל פעם, וכך בודד את האיתות היחיד והנסתר שגרם לקריסה, שיחזר אותו בצורה עקבית ואישר תיקון עבורו. תוך שעתיים בערך, קלוד סיפק תוצר שהיה צריך בשבילו באופן רגיל בין יומיים לשלושה ימי עבודה."

שתי הראיות שהבאתי מסבירות למה אנתרופיק סבורים שאם מגמת השיפור תימשך באותו קצב, הרי שעד סוף השנה קלוד כבר יהיה ברמה גבוהה יותר מזו של המתכנתים האנושיים בחברה בהתמודדות עם בעיות מכל הסוגים.

למעשה, אפשר לטעון שקלוד כבר עבר את רמת המהנדסים האנושיים לפחות בזיהוי בעיות. באנתרופיק פיתחו כלי אוטומטי שסורק כל קוד חדש כדי לאתר באגים, כשלי אבטחה ופגמים אחרים. הם הריצו אותו רטרואקטיבית – כלומר, על קוד שכתבו המפתחים האנושיים בעבר, ורק לאחר ההשקה התגלו בו באגים. קלוד מצא בערך שליש מהבאגים.

"המהנדסים שכתבו את הקוד ההוא הם מהטובים בעולם בבניית המערכות האלו." כתבו אנתרופיק. "קלוד עכשיו תופס את הטעויות שהם החמיצו."


באנתרופיק יש מבחן שהם אוהבים לעשות, בכל פעם שהם משחררים מודל חדש של קלוד: הם נותנים לקלוד לאמן בינה מלאכותית קטנה, ומבקשים ממנו לגרום לקוד לרוץ מהר ככל האפשר, אבל מבלי לפגוע ברמת התוצרים.

במאי 2025, קלוד אופוס 4 הצליח לגרום לקוד לרוץ פי שלושה יותר מהר. זו רמת הצלחה דומה לזו של חוקר אנושי מיומן, שהאיץ את הקוד פי ארבעה כשהתבקש לעשות מטלה דומה.

באפריל 2026, קלוד מיתוס (Mythos Preview) שיפר את קצב ההרצה של הקוד פי 52. קראתם נכון. ואנתרופיק מבינים את המשמעות, וכתבו כי – 

"בחלק הזה של המחקר – שיפור צעדים בניסוי מוגדר היטב – קלוד הפך מ- "עוזר מאד" לעל-אנושי תוך פחות משנה אחת."


כל חוקר יודע כמה חשובה האינטואיציה – ההבנה הפתאומית לאן צריך להתקדם מכאן כדי לפתור את הבעיה – בעבודת המחקר והפיתוח. באנתרופיק החליטו לבדוק האם המודלים שלהם מפתחים אינטואיציה דומה. הם לקחו סט של בעיות פתוחות שהחוקרים שלהם עבדו עליו בעבר, וזיהו את הרגע בו החוקר האנושי עשה טעות ועבר לבחון כיוון שגוי לפתרון, לפני שבסופו של דבר 'התאפס על עצמו' וחזר למסלול הנכון. אנתרופיק הציגו לקלוד את העבודה עד לאותה נקודה בה החוקר האנושי התבלבל, ושאלו אותו מה הוא מציע לעשות הלאה.

המודל הטוב ביותר של אנתרופיק לפני חצי-שנה – אופוס 4.5 – סיפק תשובות טובות יותר מאלו של בני-האדם ב- 51 אחוזים מהמקרים. מאז המודלים השתפרו עוד יותר, וקלוד מיתוס כבר מצליח להתעלות על האינטואיציה האנושית ב- 64 אחוזים מהמקרים. 

כדי להבהיר מה המשמעות: קלוד יכול כבר להתחיל להציע כיווני חשיבה ברמה שקרובה לזו האנושית, ואולי (רק אולי) מתעלה עליה.

זה לא אומר, כמובן, שאין לו גם טעויות. וכדרכה של בינה מלאכותית כיום, חלק מהטעויות שלו ייתפסו בעינינו כמטופשות, הזויות ומגוחכות. אבל בראייה רחבה יותר, שימוש נכון בבינה המלאכותית במחקר ובפיתוח יביא לקבלת החלטות נכונות יותר, כבר בעתיד הקרוב – דהיינו, בשנה הזאת.


כשלוקחים את כל הראיות האלו ביחד, אפשר להבין למה אנתרופיק מאמינים שבשנים הקרובות בינה מלאכותית תוכל כבר להגיע לרמה בה היא תתכנן ותריץ ניסויים בעצמה, ואפילו תוכל לשפר את עצמה מדור לדור – בלי מעורבות אנושית.

באנתרופיק בעצמם מודים שהם לא בטוחים לגמרי שנוכל להגיע לרמה הזו בקלות. נקודת המחלוקת הברורה ביותר היא שההחלטה על איזה בעיות לעבוד, עדיין מגבילה את קלוד. לא מובן מאליו שמערכות הבינה המלאכותית של היום יוכלו להתמודד עם הצורך בראייה מערכתית ואסטרטגית רחבה יותר. אבל אפילו אם הבינה המלאכותית יכולה לעשות אוטומציה 'רק' לשפע של העבודה הסיזיפית והמייגעת בעריכת ניסויים ובשיפור הדרגתי של מערכות, עדיין היא צפויה להקפיץ קדימה את המדע, הטכנולוגיה – וגם את קצב הפיתוח שלה עצמה.

וזה התרחיש השמרני והזהיר ביותר.

בתרחיש הסביר יותר לטווח הקצר, אנתרופיק חוזים שהבינה המלאכותית תמשיך להשתפר ביכולותיה – אבל בני-האדם יהיו עדיין אלו שיגדירו את כיווני המחקר ויחליטו איזה תוצרים טובים יותר או פחות. אם זה מה שיקרה, הרי שארגונים (ואנשים פרטיים) שישתמשו בבינה המלאכותית ביעילות, יוכלו להפיק תוצאות ביעילות גבוהה פי מאה, או פי אלף, מהמצב כיום. זה התרחיש שאנתרופיק מאמינים שאנחנו מתקדמים לקראתו.

אבל יש תרחיש קיצוני עוד יותר.


בתרחיש הקיצוני ביותר שמציגים אנתרופיק, הבינה המלאכותית מתחילה לשפר את עצמה בלי מעורבות אנושית או יכולת אמיתית של בני-האדם להבין את התהליך לעומק. המהנדסים בעיקר ינסו לפקח על המערכות הללו, לבחון אותן ולאמת שהן עושות את המצופה מהן ולא יוצאות משליטה.

כדי שזה יקרה, המגמות הטכנולוגיות צריכות להמשיך להתקדם באותו קצב כפי שעשו בשנים האחרונות, ומערכות הבינה המלאכותית צריכות לפתח יכולות אינטואיציה ופתרון בעיות ברמה דומה לזו האנושית. לפי הראיות שאנתרופיק הציגו עד כה, נראה שאנחנו אכן בבטחה בדרך להתממשות התרחיש הזה – למרות שכנראה לא בשנה או בשנתיים הקרובות. כנראה.

איך ייראה עולם בו הבינה המלאכותית מתכננת מחקרים ומוצרים, וגם עורכת את המחקר הנדרש כדי לממש אותם?

קודם כל, זהו עולם בו כוח המחשוב – compute, באנגלית – קובע הכל. מי שיש לו יותר כוח מחשוב בידיים, יכול להפיק תוצרים יותר מתקדמים, יותר מהר.

שנית, כפי שאני אוהב לומר כבר כמה שנים, זה יהיה עולם של ניסים ונפלאות. הבינה המלאכותית תוכל לבצע מחקרים בכל התחומים – גם בביולוגיה, בכימיה, בפיזיקה ועוד ועוד. היא תוכל גם לבנות על התוצאות שלה מהניסויים הקודמים ולנוע במהירות קדימה. המשמעות היא שנראה פיתוחים רפואיים, הנדסיים ומתמטיים שמגיעים כמעט 'יש מאין'. פריצות הדרך האחרונות במתמטיקה – עם 17 בעיות ארדוש שנפתרו מאז תחילת 2026 בלבד – מרמזות על הדרך בה עולם שכזה ייראה. נראה פתרונות לבעיות גדולות ומורכבות בכל התחומים, שמגיעים שנה אחר שנה.

ובמקביל, מדי שנה יגדל הסיכון שנאבד שליטה על המערכות שמבצעות את המחקרים הללו. כשאנחנו לא מבינים איך הן עובדות, ומתקשים יותר ויותר לעקוב אחר 'החשיבה' שמנחה אותן, הן עלולות לצאת משליטה ולקבל החלטות שאינן בהכרח לטובת האנושות.

ופה מגיעה הנקודה האחרונה של אנתרופיק: שצריך לעצור את ההתקדמות של הבינה המלאכותית.

כן, ברצינות.


אנתרופיק קובעים באופן חד-משמעי שהם היו מעדיפים לעצור את התפתחות הטכנולוגיה – אותה טכנולוגיה שהפכה אותם לאחת מהחברות החשובות והמוערכות בעולם.

"אנחנו חושבים שזה היה דבר טוב, אם היה אפשר להאיט באפקטיביות את התפתחות הטכנולוגיה," הם כותבים, "כדי לתת לעצמנו יותר זמן להתמודד עם ההשלכות העצומות שלה."

הצרה היא שלא ברור איך אפשר לוודא שכולם מאיטים באותו הזמן. אנתרופיק לא מנוהלת על-ידי ילדים קטנים, והם מבינים היטב שבמירוץ החימוש הנוכחי בין המעצמות והחברות, אם רק צד אחד עוצר – הרי שהצד השני ימשיך לרוץ קדימה בכל הכוח.

ההצעה של אנתרופיק היא להקים מערכות שיפקחו על המעבדות המובילות בעולם, כדי לוודא שהן באמת האטו את קצב הפיתוח שלהן. מערכות כאלו יצטרכו לנטר אחר מעבדות בכל העולם, ואותן מעבדות יצטרכו להסכים לעצור או להאט את פעילותן ביחד.

זוהי הצעה יפה, שמזכירה את האמנות הבינלאומיות שנחתמו כדי להאט את קצב הפיתוח של הנשקים הגרעיניים. אבל האם אפשר באמת להוציא אותה לפועל? אנתרופיק לא בטוחים, אבל מוכנים לנסות.

"בחודשים הקרובים נארגן כנסים בהם קובעי מדיניות, חוקרים, שומרי סף וחברות בינה מלאכותית אחרות יוכלו לעזור לענות על חלק מהשאלות שהועלו בדו"ח הזה," הם כותבים בסוף המסמך, "ובמיוחד בנוגע לשיפור עצמי רקורסיבי מלא, ואיך ליצור אפשרויות טובות יותר לתיאום ולחשיבה משותפת. נפרסם את מה שיוצא מהכנסים האלו."

מסתמן שאנחנו נכנסים לישורת האחרונה לפני ההגעה ל- "התפוצצות האינטיליגנציה" – מונח שטבע אירווינג ג'ון גוד לפני שישים שנים. זה יהיה הזמן בו הבינה המלאכותית תוכל לשפר את עצמה בכוחות עצמה, ו- "האינטיליגנציה של האדם תיוותר הרחק מאחור."

חוקר הבינה המלאכותית ורנור וינג' קבע ש- "זמן קצר לאחר מכן, יסתיים עידן בני-האדם."

מה יבוא אחריו? קשה לדעת. אבל אנתרופיק מודעים היטב לאחריות שנופלת על כתפיהם.

"חלון הזמן לחקירת השאלות הללו ביחד הוא כאן," הם כותבים, "ואנשים מחוץ לחברות הבינה המלאכותית צריכים להיות מעורבים בדיונים."

FAQ קצר

מה טוענת אנתרופיק לגבי Claude?
לפי הטקסט, אנתרופיק מציגה שיפור חד ביכולות Claude בכתיבת קוד, תיקון תקלות, שיפור ביצועים והצעת כיווני מחקר.

מהו שיפור עצמי רקורסיבי?
זהו תרחיש שבו מערכת בינה מלאכותית אינה רק מסייעת למהנדסים, אלא משתתפת בתכנון ובשיפור של הדורות הבאים של מערכות AI.

למה אנתרופיק מבקשת להאט את הפיתוח?
החשש הוא שמערכות AI יתקדמו מהר יותר מיכולת הפיקוח, ההבנה והבקרה של בני האדם, במיוחד אם כמה חברות או מדינות ימשיכו להתחרות זו בזו ללא תיאום.

מה המשמעות למתכנתים ולחוקרים?
בטווח הקצר, המשמעות היא מעבר מכתיבה ידנית של קוד וניסויים לניהול, הכוונה ובקרה של מערכות AI. בטווח הארוך יותר, ייתכן שינוי עמוק באופן שבו מתבצע מחקר ופיתוח.

עוד בנושא באתר הידען: