מטא משחררים מודל AI חדש ופתוח

למה 3.1, והוא מתחרה בהצלחה בבינות המלאכותיות המתקדמות ביותר כיום מתוצרת OpenAI ואנתמורפיק. ועדיין, כאמור, מטא משחררת אותו בחינם לכל דורש

מודל הבינה המלאכותית LLAMA 3.1 הופך לקוד פתוח. איור: אתר הידען באמצעות DALEE. התמונה אינה מהווה תמונה מדעית.

אם מישהו היה מעניק לכם מתנה שעלתה לו מיליארדי דולרים, לגמרי בחינם, האם הייתם מוכנים לקבל אותה? בלי התחייבות. בלי דרישות מקדימות. פשוט קחו. מוכנים?

זו השאלה העומדת כיום בפני העולם, כאשר חברת מטא – זו שעומדת גם מאחורי פייסבוק, ווטסאפ ואינסטגרם – משחררת בחינם את מנוע הבינה המלאכותית החדש ביותר. שמו של המנוע הוא למה (Llama). למה 3.1, והוא מתחרה בהצלחה בבינות המלאכותיות המתקדמות ביותר כיום מתוצרת OpenAI ואנתמורפיק. ועדיין, כאמור, מטא משחררת אותו בחינם לכל דורש.

והשאלה שכולנו צריכים לשאול – ואכן שואלים – היא, למה? למה לתת את הלמה ללא תשלום? ומכיוון שאין בעולם הזה ארוחות חינם, כמה נשלם בסוף, ובאיזו דרך?

כדי לנסות אפילו לענות על השאלות הללו, אנחנו צריכים להבין קודם מהי בכלל אותה למה. ככה.

על מה ולמה

מנועי הבינה המלאכותית המתקדמים ביותר בשוק כיום הם GPT4-O וקלוד 3.5. אלו מנועים 'סגורים'. כלומר, החברות שפיתחו אותם מציעות למשתמשים גישה למנועים הללו בתמורה לתשלום חודשי, או לפי כל פנייה למנוע. למה 3.1 פועלת בצורה שונה: מטא שחררה אותה לחופשי. כל מי שרוצה יכול להוריד אותה אליו למחשב ולהריץ אותה. נכון, אתם צריכים מחשב עם כרטיס גרפי חזק כדי להריץ את הגרסה המשוכללת ביותר של למה 3.1, אבל לחברות ולמפתחים יש מחשבים כאלו בשפע.

אבל האם בכלל אנשים ירצו להריץ אותה? אם להסתמך על היכולות של למה 3.1, התשובה היא כן מהדהד. הלמה החדשה מתמודדת ראש-בראש עם שני המנועים המתקדמים ביותר כיום, ואפילו עוקפת אותם במבדקים מסוימים. היא עוקפת את קלוד ביכולות המתמטיות שלה ( לפי מבדקי GSM8K, MATH), למשל, ואת GPT4-O ביכולותיה למלא אחר הנחיות (IFEval). היא משאירה את שניהם מאחור מבחינת יכולת השימוש בכלים דיגיטליים. וכן, היא גם מפסידה למתחרים שלה בקטגוריות מסוימות, אבל הנקודה היא שהלמה יכולה לעמוד על אותו פודיום של המנצחים הגדולים באולימפיאדת ה- AI בלי להתבייש. היא זכתה במקום הזה בכבוד.

וכן, היא פתוחה. לא סתם פתוחה לשימוש, אלא גם להורדה ולהטמעה בכל מחשב. וזה עניין מאד, מאד גדול.

החשיבות שבפתיחות

באמצע 2023 החליט מהנדס בסמסונג לבדוק האם ChatGPT יכול לעזור לו לשפר את הקוד שכתב. הוא העלה את הקוד ל- ChatGPT, קיבל עצות טובות יותר-או-פחות, והשלים את העבודה בזמן.

בינתיים, כל נורות האזעקה של קציני הבטיחות של סמסונג התחילו להבהב באדום, בזמן שהסירנות ייללו בלי הפסקה. כי הם הבינו את מה שאותו מהנדס תמים לא קלט: שכל מידע שאתה מעלה לאינטרנט, עובר דרך כבלי הרשת, דרך נתבים אינספור במדינות שונות ובסוף מגיע לשרתים של חברות אחרות כמו OpenAI ומיקרוסופט. כל שלב כזה בתהליך מהווה פרצת אבטחה. מדינות יכולות לנסות לכרות את התוכן החשוב באמצעות פריצה לכבלים שמעבירים את המידע או לנתבים. הן יכולות לכפות על החברות שמאחסנות את המידע לשתף אותו עם הממשלה. האקרים יכולים לפרוץ לחברות ולקחת את המידע הביתה – ואז להשתמש בו כדי להבין איך לפרוץ גם לשרתים של סמסונג עצמה.

אם זה לא מספיק, הרי ש- OpenAI עצמה עלולה להשתמש במידע כדי לאמן את המודלים הבאים שלה. מומחים לבינה מלאכותית שיודעים לדבר איתה בדיוק נכון, עלולים למצוא דרכים לאחזר חלקים מהקוד של סמסונג, מתוך כל המידע שהבינה המלאכותית תאומן עליו. אף חברה לא רוצה שהקוד הפנימי והסודי ביותר שלה ייחשף בעקבות בקשה ל- ChatGPT.

סמסונג לא שיתפה מה היה סופו של אותו מהנדס, אבל את ההחלטה הסופית שלה אנחנו יודעים היטב: היא הודיעה ברבים שהעובדים שלה אינם יכולים להשתמש מעכשיו ב- ChatGPT. ואליה הצטרפו גם חברות אחרות כמו אמזון, JPMorgan, סיטיגרופ, וולס פרגו, גולדמן זקס ואחרות. כולן חוששות להוציא את המידע מתוך השרתים הפנימיים שלהן, ולפיכך עובדיהן אינם מסוגלים להשתמש במנועי הבינה המלאכותית המשוכללים ביותר של היום כדי לייעל את עבודתם.

ופתאום, למה.

תוך חודשים ספורים מהיום, למה 3.1 תותקן באלפי שרתים של חברות קטנו, בינוניות וגדולות בכל העולם. היא תאפשר לכל עובד לעבוד עם אחת הבינות המלאכותיות המשוכללות ביותר כיום, מבלי שיצטרך לדאוג שהמידע יודלף לרשת. ויותר מזה: למה 3.1 תהיה יעילה יותר עבור העובדים, מכיוון שהמודל פתוח ואפשר לאמן אותו על המידע הפנימי העצום ששמור בשרתים של כל חברה.

מה המשמעות? ניקח כדוגמא תיאורטית-לגמרי את קופת חולים כללית. הקופה רוצה להעמיד רופא-מלאכותי שיוכל לאבחן ביעילות גבוהה כל חולה, אבל היא מפחדת. למה? מכיוון שכדי להפיק רופא כזה, צריך לאמן אותו על כל המידע הרפואי שיש לקופת חולים כללית על המטופלים שלה, והקופה לא מעוניינת לשחרר את המידע הזה לרשת מסיבות ברורות. כן, היא יכולה להעביר את המידע "אנונימיזציה" – כלומר, לנסות לסלק ממנו פרטים שמעידים על זהות החולה – אבל תהליכים כאלו לעולם אינם מושלמים. אז קופת חולים כללית נשארת תקועה עם אוסף עצום של מידע, שהיא פשוט לא יכולה להשתמש בו ביעילות כדי לאמן את הבינה המלאכותית של הדור הבא.

ופתאום, למה. ועכשיו כללית יכולה להתקין את הבינה המלאכותית של הדור הבא בשרתים הפנימיים שלה, לאמן אותה על כל המידע הרפואי של החולים מבלי חשש לדליפת מידע – והנה יש לה רופא ממוחשב שמתאים בצורה מושלמת לחולים של כללית.

קחו את אותו עקרון וישמו אותו עבור פקידים, אנליסטים, יועצים ביטוחיים וכל מקצוע אחר שאפשר למצוא בחברות הגדולות. אם עד עכשיו היו הרבה תלונות על כך ש- GPT לא מבין את הקונטקסט המדויק של המטלות שנותנים לו, הרי שהן יתחילו להיפתר בקרוב בתוך החברות. הבינה המלאכותית החדשה, על בסיס למה, תדע לעשות את העבודה של רבים טוב יותר מהם – פשוט מכיוון שהיא תזכה להתאמן על כל המידע שהפיקו קודמיהם בתפקיד. סביר מאד להניח שאחרי אימון שכזה, למה 3.1 תהיה חזקה יותר מכל מנוע אחר בביצוע מטלות בתוך החברות.

וכל חברה תרצה להתקין את למה 3.1 אצלה, כי מטא לא דורשת שום דבר – שום דבר בכלל – בתמורה לשימוש בה. רק תוריד, תתקין ותריץ. זהו.

אבל למה?

מי יודע מדוע ולמה

פיתוח של בינות מלאכותיות חדשות מסוגו של ChatGPT אינו עניין זול, בלשון המעטה. כשחברת OpenAI השיקה את GPT3 – אביו של ChatGPT – ב- 2020, ההערכות היו שהיא הוציאה כמעט חמישה מיליון דולרים על תהליך האימון של הבינה המלאכותית. כדי להשיק את GPT4, הם כבר היו צריכים להשקיע יותר ממאה-מיליון דולרים. לפי מקור פנימי אחד, הם כבר הוציאו מיליארד דולרים כדי לאמן את GPT5, ועוד היד נטויה.

חברות בשוק הקפיטליסטי אינן מבזבזות מאות-מיליוני דולרים לשווא. הן צריכות לראות בכך רווח. למזלה של OpenAI, נראה שהיא מצליחה בכך. לפי ניתוח מיוני 2024, הכנסות החברה עומדות על כמעט 3.5 מיליארד דולרים בשנה. אחת המתחרות הגדולות ביותר שלה, אנתמורפיק, צפויה להגיע להכנסות של 850 מיליון דולרים ב- 2024. את הסכומים האלה הן גורפות בזכות גביית דמי מנוי ודמי שימוש במנועי הבינה המלאכותית שהן מפתחות, כאמור, בהון-תועפות.

ואז מגיעה מטא, מאמנת מודל בעלות משוערת של יותר ממאה-מיליון דולרים… ומציעה אותו בחינם.

ואם להסתמך על ניסיון העבר, כנראה שזה רעיון ממש טוב. לפחות עבור מטא.

כוחו של החינם

כאשר הסטודנט הפיני לינוס טורוולדס פתח בפרויקט אישי ליצירת מערכת הפעלה חינמית ב- 1991, הוא לא דמיין שיבוא יום ואלפי מתכנתים ומפתחים ישקיעו את מיטב מרצם ורעיונותיהם בשיפור אותה מערכת. בחינם. או שחברות-ענק כמו יבמ, דל ו- HP ישתמשו במערכת ההפעלה שלו, למרות היותה שקופה לגמרי ופתוחה לשינויים.

ואף על פי כן.

טורוולדס כינה את מערכת ההפעלה שלו "לינוקס", והתיר לאחרים להציע רעיונות כיצד לשפר אותה – ולשלוח לו פיסות קוד שיוכל לברור ולשלב במערכת. עשרות, מאות ובסוף אלפי מתכנתים החלו לשלוח לו כיוונים לשיפור, וטורוולדס מצא עצמו טובע תחת העומס. הוא נאלץ להקים ארגון שלם כדי לברור את ההצעות והקודים הטובים ביותר ולהטמיע אותם במערכת. אותה מערכת, אני מזכיר, שכל אחד היה יכול להוריד מהרשת ולהשתמש בה. כל אינדיבידואל, כל חברה, בעלות של אפס מאופס.

מאיפה הכסף? בעיקר מתרומות, למרות שהן לא בדיוק מוגדרות כך. חברות גדולות כמו אריקסון, אינטל, מיקרוסופט ואחרות, תורמות לארגון של טורוולדס מאות-אלפי דולרים בשנה על "מנוי פלטינום". בתמורה לסכום הפעוט הזה (שמקביל בערך למשכורת של מהנדס בכיר אחד בחברות הללו), הן מקבלות את הזכות לשבת מסביב לשולחן ולהיות מעורבות בתהליך קבלת ההחלטות שקובע איך תיראה הגרסה הבאה של לינוקס. ואפילו אם יכולת ההשפעה הממשית שלהן מוגבלת, הן לפחות לומדות על השינויים הצפויים מבעוד מועד, ויכולות להתאים את עצמן לעתיד שמסביב לפינה.

למה זה חשוב כל-כך לחברות להשפיע על הדרך בה לינוקס תעבוד, או אפילו להבין מראש איך ייראה כל שדרוג של המערכת? מכיוון שלינוקס מעורבת כיום בפעולתם התקינה של שרתים ומחשבים בכל העולם. כארבעה אחוזים מהמחשבים הפרטיים מריצים את לינוקס. כמעט כל השרתים (96.4 אחוזים משרתי הרשת הגדולים בעולם) נסמכים על לינוקס. כל מחשבי-העל הקיימים כיום מתבססים על לינוקס, לצד טלוויזיות של סמסונג ו- LG, רכבים חכמים (טסלה, יונדאי ואחרות) ואפילו טילים המשוגרים לחלל.

כל אלו משתמשים במערכת חינמית ופתוחה לגמרי, שהפכה להיות כל-כך גדולה וחשובה לתעשייה, שאף חברה רצינית בתחום המחשוב לא יכולה להרשות לעצמה שלא להשתמש בה. ולא רק זאת, אלא שהחברות מעודדות את המהנדסים והמפתחים שלהן לתרום ללינוקס קוד ורעיונות לשיפור, כדרך לזכות בתהילה – ואולי לקדם את הכיוונים שלהן עוד קצת.

מטא, כמובן, רוצה לעשות בדיוק את אותו הדבר עם למה 3.1. צוקרברג עצמו הבהיר במכתב שהוציא לאחרונה, שלינוקס מהווה דוגמא לדרך בה קוד פתוח יכול לגבור על "קוד סגור". מטא שחררה את מודלי למה לתעשייה כדי שכולם ישתמשו בלמה במוקדם-או-במאוחר – ויש סיכוי טוב שזה באמת מה שיקרה.

אבל מה מטא מקבלת מכך שכולם ישתמשו במנוע שלה?

כוח

אם עד עכשיו העולם נשמע יפה מדי, ובכן, יש לכך סיבה. כל מה שתיארתי נכון בהחלט. חברות אכן יכולות להוציא קוד פתוח בחינם, ואפילו להתפרנס מכך לא-רע באמצעות תרומות, מהרגע שהוא מגיע לגודל מתאים. אבל יש גם צד אנוכי יותר לעניין. ספציפית, מי שמפתח את הקוד שכל היתר משתמשים בו, מקבל כוח. ואפילו הרבה מאד ממנו.

החברות שמעמידות את המערכות שכל היתר משתמשות בהן, קובעות את כללי השימוש במוצהר או במשתמע. הן יכולות לנסות להגדיר במדויק מי יכול להשתמש באיזו מערכת ולמה, או שהן יכולות לעצב את המערכת כך שלא תאפשר שימושים מסוימים. ומי שינסה לפעול כנגד החברה – יגלה בדרך פלא שהמערכת הנפוצה בעולם אינה תומכת בשימושים שלו יותר.

זה הכוח שיכולה לזכות בו חברה שעומדת מאחורי המוצרים "החינמיים" ו- "הפתוחים" הגדולים בשוק. ולמרות שאני לא מאשים את מטא בדבר, כמובן, אומר רק שיהיה מוזר למצוא חברה שתחלוש על מוצר עצום, ולא תשתמש בכוח שבידיה כדי לוודא שהוא מותאם יותר לצרכים שלה ולא, נאמר, של המתחרות. על הדרך, מטא יכולה ליהנות גם מכל החדשנות של סטארט-אפים שנסמכים על הבינה המלאכותית שלה, ותוכל לרכוש אותם ולשלב אותם בעולם שלה יותר בקלות.

כל זה עשוי בהחלט להצליח למטא, אם היא תקבע את למה כ- "מערכת הבינה המלאכותית של התעשייה". זו עשויה להיות גם הסיבה שלמה 3.1 מוצלחת כל-כך בשימוש בכלים – יותר מכל המתחרות – ואפילו בכלים שמעולם לא ראתה מעולם. היא נועדה להיות המערכת הבאה שכל התעשייה תשתמש בה. ועל הדרך, להקנות למטא כוח עצום בעיצוב העתיד.

אבל זאת, כמובן, בהנחה שבכלל יהיה עתיד. כי למה 3.1 מדגימה את הכיוון הגדול יותר אליו אנו הולכים: זה בו כל ילד זוכה בכוח להריץ בינות-על במחשב הגיימינג הביתי שלו.

למה לתת כוחות-על לכולם

חשבו על עולם בו כל ילד יכול להריץ בינה מלאכותית מתקדמת במחשב שלו כדי לקבל תוכניות מפורטות ומרשימות לביצוע פיגועי טרור. או ליצירת וירוסים במעבדה. או לסינתזת חומרי לחימה כימיים קטלניים חדשים. או להשתלטות על העולם.

בעצם, עזבו ילדים. ארגוני טרור, או צבאות לאומיים, יוכלו להריץ את למה 3.1 לכל מטרה זדונית שירצו. הם יוכלו לפתח באמצעותה סוכני טרור מתקדמים, לייצר וירוסי מחשב ולפרוץ למחשבים בעלי אבטחה חלשה. באותו הזמן, ארגוני מודיעין יוכלו לאמן אותה על המידע הפנימי שלהם כדי לקבל את סוכני המודיעין והאנליסטים המוצלחים ביותר, כדרך להמשיך לנטר אחר האוכלוסייה.

כיום אפשר למנוע חלק משמעותי מהשימושים השליליים, מכיוון שחברות הבינה המלאכותית מנטרות את הבקשות שהן מקבלות. מספר גדול של בקשות שיובילו לשימוש זדוני במערכת, יוביל לכך ש- OpenAI לא תאפשר לאותם משתמשים להמשיך לשלוח בקשות למערכת.

אבל מה קורה כשאף אחד לא שולט יותר בבינה המלאכותית? כשמטא פשוט משגרת את הגרסה המשוכללת והמתקדמת ביותר לעולם הרחב – ומצפה ומקווה שכולנו נעשה בו שימוש לטובה?

ובכן, מטא לא תמימה עד כדי כך. היא הטמיעה בלמה 3.1 כמה מגבלות לגבי אופן השימוש בה, וכמה דרכים לנסות להגן על הבינה המלאכותית מנסיונות פריצה. אבל אפשר לעקוף גם אותן, וזה אפילו לא יהיה קשה במיוחד למי שיודע לעבוד עם בינה מלאכותית. כלומר, לכל ילד בן 12 ולכל טרוריסט מתחיל בעוד עשור.

האם המשמעות היא שכולנו אבודים? לא הייתי ממהר כל-כך לקבור את כולנו. כן, ילדים, טרוריסטים והאקרים-בשירות-המדינה ישתמשו בבינות מלאכותיות פתוחות כדי לקבל כוחות-על. אבל לצידם, גם אנשים טובים וממשלות שרוצות להגן על אזרחיהן יקבלו כוחות-על דומים. בעתיד, כמו בעבר, מערכות נשק ומגננה יפותחו במרוץ בלתי-פוסק. זו סיבה מצוינת נוספת עבור כל מדינה שלא להישאר מאחור, ולהמשיך להשקיע בבינה המלאכותית ובאנשים שמפתחים ועובדים איתה.

למה? עכשיו אתם יודעים.

עוד בנושא באתר הידען:

קטגוריות: בינה מלאכותית, עתידנות טכנולוגית
תגיות: WhatsApp, אבטחת מידע, אינסטגרם, אמזון, בינה מלאכותית, המדריך לעתיד, לינוקס, מודל פתוח, מטא, סמסונג, פייסבוק, קוד פתוח, רובוטים, רועי צזנה

ד"ר רועי צזנה

לבלוג של ד"ר רועי צזנה מדע אחר ד"ר רועי צזנה הוא מחבר הספרים "המדריך לעתיד" ו"השולטים בעתיד"

לכל הכתבות של המחבר

מטא משחררים מודל AI חדש ופתוח

על מה ולמה

החשיבות שבפתיחות

מי יודע מדוע ולמה

כוחו של החינם

כוח

למה לתת כוחות-על לכולם

ד"ר רועי צזנה

משבר האקלים מחריף את הסכסוכים בימת צ’אד ובסאהל

דנ"א בן 7,000 שנה משנה את סיפור המהפכה הניאוליתית בצפון אפריקה

האקדמיה הלאומית למדעים ממליצה להקים קרן לאומית למדע יישומי

לוויין ישראלי־גרמני ימפה עננים בתלת־ממד לשיפור תחזיות אקלים

האם בינה מלאכותית היא רק כלי? מחקר מזהיר שהיא עלולה לשנות את תפיסת המציאות