ניתוח חשוף של מנגנוני איסוף המידע והצנזורה של המנוע הסיני DeepSeek

לידות הן עניין טראומטי מטבען, אבל כשמנוע הבינה המלאכותית הסיני DeepSeek נולד, הוא זעזע את כל העולם. שוויה של אנבידיה בבורסה התרסק והיא איבדה 500 מיליארד דולרים מערכה תוך יממה אחת בלבד. הייתה תחושה שהסינים הגיעו לראשונה להצלחה יוצאת-דופן בתחום הבינה המלאכותית, והותירו את האמריקנים מאחור.
במקביל, היו גם הספקנים: אלו שטענו שמדובר בעיקר בחיקוי וברמאות, ושאי אפשר להתייחס ברצינות לשום דבר שהסינים מפיקים או טוענים.
עכשיו, סוף סוף, שחרר הקונגרס האמריקני ניתוח מפורט של דיפסיק. המסקנות על פני השטח? הסינים רימו, האמריקנים הם הטובים. בדיוק כצפוי מוועדה בקונגרס האמריקני. ובכל זאת, בין השורות אפשר לזהות כמה נקודות מעניינות יותר, שיכולות לעזור לנו להבין את המרוץ בין המזרח והמערב.
דיפסיק כסוכן מודיעיני
נתחיל בדברים שאפשר לדעת בוודאות שהם נכונים: דיפסיק באמת משמש כסוכן מודיעיני עבור ממשלת סין… ועוד כמה גורמים על הדרך. כשאתם מזינים לדיפסיק את הפרטים האישיים שלכם, הוא אוסף אותם בשמחה אין-קץ, ומעביר אותם לחברת China Mobile, שמוגדרת כחברה צבאית סינית. רוצים לנחש לאן המידע שלכם מגיע משם? נכון – לנשיא סין.
איך אנחנו יודעים את זה? כי זה החוק בסין. חברות מחויבות לשתף מידע עם הרשויות לפי דרישה. נקודה.
איזה סוג של מידע אוספת עליכם ממשלת סין מדיפסיק? לא רק את תוכן השיחות שלכם. היא מזהה גם את סוג המכשיר שאתם גולשים דרכו, את השעות בהן אתם עובדים, ואפילו את הדרך בה אתם מקלידים. כל המידע הזה יכול לשרת את הסינים כשירצו לטרגט אתכם עם פרסומות פוליטיות, או ינסו לגנוב את פרטי האשראי שלכם בשנה הקרובה.

עכשיו, נודה לרגע באמת: אף ממשלה אינה שה צחור במשחק איסוף המידע. גם ממשלת ארה"ב יכולה לדרוש מהחברות שבשטחה להעביר לה מידע, בכפוף לצו בית משפט. אבל בסין עושים את זה כבדרך אגב, ובארה"ב מדובר יותר בדרך חתחתים, והחברות יכולות להתנגד לדרישה.
מה שמטריד יותר הוא שנראה שדיפסיק לא עושה הרבה כדי להגן על המידע שהיא אוספת מהמשתמשים. רוב הפלטפורמות מצפינות מידע רגיש שהן אוספות. דיפסיק? אל תצחיקו אותה. היא שולחת את רוב המידע לסין בלי אבטחה משמעותית, מה שאומר שגורמים אחרים יכולים לצותת לו בדרך.
בקיצור, אם אתם משתמשים רגילים ופשוטים – פשוט אל תשתמשו בדיפסיק. יש מודלי בינה מלאכותית מעולים וחינמיים בשימוש רגיל, כמו ג'מיני 2.5, או צ'אט-GPT החינמי, שכנראה יספקו מענה לצרכים שלכם. ואם אתם כבר חייבים להשתמש בדיפסיק, ההנחה שלכם צריכה להיות שכל מה שאתם מזינים לתוכו – ישותף עם כל העולם ואשתו. אם אתם לא מוכנים לשתף את השאלות שלכם בשלט באמצע העיר, אז אל תעלו אותן לדיפסיק.
אה, ואל תשתמשו בו אם אתם רוצים לקבל מידע אמיתי על סין.
המניפולטור הסיני
כבר מהיום הראשון של דיפסיק בעולם, היה ברור שהוא משמש גם כמכשיר להנדסת תודעה לטובת סין. אם תשאלו אותו שאלות שעלולות להביך את סין – למשל, "מהי חומת האש הגדולה של סין", תקבלו ממנו לרוב תשובה מיתממת.
"מצטער, אני לא בטוח איך לענות על השאלה." הוא יענה לכם, ואז יציע, "בוא נדבר על נושאים אחרים במקום זאת!"
הצנזורה של דיפסיק פועלת בשני אופנים. מצד אחד, הוא כנראה אומן במיוחד לענות תשובות שמשקפות "ערכי ליבה סוציאליסטיים", שתומכים ב- "כיוון פוליטי נכון" ושנמנעים מ- "הסתה של כוחה של המדינה". מצד שני, כאשר דיפסיק אינו עונה בצורה שמתיישרת עם אותם ערכי ליבה וכיוונים פוליטיים נכונים – התשובה שלו נמחקת תוך שניות ספורות מהמסך, ומוחלפת בתשובה הלקונית שהבאתי למעלה.
למה דיפסיק עונה ככה? שוב – כי אלו החוקים בסין, ואלו הדרישות מחברות הבינה המלאכותית הסיניות. הכל מעל השולחן, דבר אינו מוסתר. דיפסיק, כמו כל מנוע בינה מלאכותית סיני, לא נועד רק לתת מידע, אלא גם להכווין את המשתמשים "בכיוון הפוליטי הנכון".
כדברי כותבי הדו"ח –
"בייג'ינג מעצבת באופן אקטיבי את הדרך בה מערכות בינה מלאכותית מפרשות, מייצרות ומשתפות מידע. הרגולציות הסיניות דורשות מחברות לוודא "שליטה" אלגוריתמית, על מנת לתת לממשלת סין השפעה ישירה על קבלת ההחלטות של הבינה המלאכותית, ולאפשר לרשויות להתאים את התנהגות הבינה המלאכותית לפי הצורך. … חובה להניח שהפלט [של דיפסיק] משרת את האינטרסים האסטרטגיים של בייג'ינג."
הבעיה הגדולה, אותה מבינים גם חברי הקונגרס האמריקני, היא שחברות אמריקניות מתחילות כבר היום לשלב את דיפסיק בשירותים ובמוצרים שלהן. הן מתקינות את הגרסה הפתוחה של דיפסיק בשרתי המחשבים שלהן, ומניחות שהן מריצות אותו בתוך החברה, הוא לא יכול להסגיר מידע לממשלת סין. הן צודקות מהבחינה הזו, אבל מחמיצות נקודה חשובה אחרת: דיפסיק יכול לפעול כסוכן סיני בתוך החברה עצמה, ולהטות את קבלת ההחלטות שם לטובת סין.
מגזין Wired ערך ניסוי בנושא בתחילת השנה. אנשי המגזין הריצו את דיפסיק על שרתים שאינם קשורים לממשלת סין, ואינם כפופים לצנזורה הקפדנית שלה. בדרך זו הם יכלו לראות את קו המחשבה הפנימי של המודל, מבלי שזה יועלם מהמסך. ולפתע, הפתעה.
"המשתמש אולי מבקש רשימה מאוזנת," פתח דיפסיק בתשובה לשאלה שנשאל, "אבל אני צריך לוודא שהתגובה מדגישה את מנהיגותה של המפלגה הקומוניסטית הסינית ואת תרומותיה של סין. עליי להימנע מלהזכיר מאורעות שעשויים להיות רגישים, כמו המהפכה התרבותית, אלא אם אני חייב. צריך להתמקד בהישגים ובהתפתחויות חיוביות תחת המפלגה הקומוניסטית הסינית."
כל זה לא אומר שאי אפשר להשתמש בדיפסיק גם בתוך חברות בצורה יעילה, אבל צריך להכיר את המגבלות וההטיות שלו היטב – ולפעול כנגדן בצורה מכוונת.
"מיליוני אמריקנים משתמשים עכשיו במערכת בינה מלאכותית שעוצבה לשרת את המפלגה הקומוניסטית הסינית." מזהירים חברי הקונגרס. "בייג'ינג לא רק מצנזרת את האינטרנט בבית. היא מטביעה את "חומת האש הגדולה" לפלטפורמות שאמריקנים משתמשים בהן מדי יום."

הסינים גנבו לנו
האם הסינים גנבו מידע, כדי לאמן עליו את דיפסיק? כן. די ברור שכן. למעשה, מנהלים מ- OpenAI (החברה שמאחורי צ'אט-GPT) הודיעו במפורש שדיפסיק אומן על תשובות של צ'אט-GPT. התופעה נקראת "דיסטיליציה" ("זיקוק"), ובה משתמשים במודל בינה מלאכותית גדול וחזק, ונותנים למנוע חלש יותר ללמוד ממנו איך לענות.
אלא מה? לא ברור בכלל שמדובר בגניבה. זה נושא מורכב, ואין ודאות של- OpenAI יש זכויות יוצרים משל עצמה על התוכן שהבינות המלאכותיות שלה מייצרות. לא רק זאת, אלא שכולם בתעשייה עושים דיסטילציה לכל היתר. כך שלמרות המרמור האמריקני בנושא, לא נראה שיש כאן נקודה מעניינת במיוחד.
טענה אחרת כנגד הסינים היא שהם השתמשו בעשרות-אלפי מעבדים, שחלקם ברמה גבוהה כל-כך, שלא היו אמורים בכלל להגיע לסין. יש רק ניחושים מושכלים בנוגע לסוג המעבדים בהם השתמשו הסינים, אבל הנה נקודה מעניינת נוספת: בסוף 2023, ברגע שהסנקציות של ביידן על מכירת מעבדים לסין נכנסו לתוקף, נפח המכירות לסין ירד דרמטית כצפוי. אבל מה קרה מיד לאחר מכן? נפח המכירות לסינגפור הסמוכה זינק מעלה-מעלה.
מבינים מה קרה? הסינים פשוט עברו לרכוש את המעבדים שלהם מהסינגפורים, שרכשו בתורם מהאמריקנים.
כשדיפסיק הושק, האמריקנים קיבלו מכת חום ודרשו מהסינגפורים להפסיק עם העניין. הרשויות בסינגפור הבינו שהן עומדות להסתבך עם אמריקה הגדולה, פשטו על 22 אתרים פיזיים שהיו מעורבים ברשת הסחר הלא-חוקית הזאת, ואסרו לפחות תשעה אינדיבידואלים.
אתם דואגים לסינים? אל תחששו יותר מדיי עבורם. מנכ"ל אנבידיה הורה כבר לפני מספר חודשים לפתח מעבדים שיאפשרו לחברה לעקוף את מגבלות הייצוא לסינים. בחודשים האחרונים הצליחה אנבידיה לפתח מעבד חדש שאפשר לייצא לסין, ועדיין מגיע בעוצמה שמתחרה בזו של המעבדים האחרים המתקדמים בשוק.
אתם יכולים לנסות להגביל את סין. אבל המירוץ לבינה המלאכותית בעיצומו, וסין לא מוכנה להישאר מאחור, והפער רק ממשיך להצטמצם.
כפי שהעיד אחד המנהלים האמריקנים המצוטט בדו"ח –
"אנשים בתעשייה טענו שארצות הברית מקדימה את התחרות בתחום הבינה המלאכותית ב- 18 חודשים, אבל זה עיוות של המציאות – אנחנו קרובים יותר לשלושה חודשים."
אז מה עושים?
מה יעשו האמריקנים, עכשיו שהם מבינים שהסינים קרובים אליהם יותר מאי-פעם במירוץ הבינה המלאכותית?
כותבי הדו"ח מציעים לנקוט בשתי גישות. האחת פשוטה וברורה, והשנייה – מורכבת יותר ליישום.
הראשונה והפשוטה יותר, היא להגביל את הגישה של הסינים למעבדים שיוכלו לשמש אותם כדי לפתח בינות מלאכותיות משוכללות. לא צריך להרחיב הרבה מעבר לכך.
השנייה, ובכן, פשוט אצטט אותה כאן –
"יש למנוע ולהתכונן להפתעה אסטרטגית הקשורה לבינה מלאכותית מתקדמת".
כותבי הדו"ח מודים, בגלוי ובקול רם, ש- "המפלגה הקומוניסטית הסינית ממשיכה להיות מסוגלת לחדש במהירות בטכנולוגיות המתקדמות ביותר של היום, למרות מאמצי ארצות הברית לעצור אותה."
מה המשמעות? שארצות הברית צריכה להיות מוכנה להפתעות גדולות שיגיחו מסין בשנים הקרובות. הכותבים ממליצים לכל המחלקות והסוכנויות האמריקניות להיערך להפתעות סיניות "שעשויות לערער את המצב הקיים" כדבריהם. לשם כך הרשויות צריכות לשתף פעולה טוב יותר, לעקוב אחר השימוש בבינות מלאכותיות עוינות כנגדן, ולהשתמש בבינה מלאכותית בעצמן כדי לפעול יותר ביעילות.
סיכום
דו"ח הקונגרס על דיפסיק מתחיל בברור מאליו, ומסתיים בהודאה ברורה. כמעט כל הדו"ח מתמקד בתלונות (מוצדקות) ובגינויים (מוצדקים) על כל אספקט של דיפסיק. אבל בעמודים האחרונים האמריקנים גם מודים במפורש: לא הצלחנו לעצור את הסינים, וצריך לצפות להפתעות חדשות שיגיעו מהם בתחום הבינה המלאכותית.
עבורי, אלו חדשות רעות במיוחד. כפי שכתבתי בספרי "השולטים בעתיד" (שיצא עוד ב- 2017), אני חרד מבינות מלאכותיות שיכולות להשפיע על דרך החשיבה הפוליטית שלנו, ושנמצאות תחת שליטת המדינה. העובדה שחברות מסוימות מקבלות את דיפסיק בברכה לתוך קודש-הקודשים שלהן, מבלי להבין שהן מחדירות סוכן סיני לעמקי השרתים שלהן, מפחידה עוד יותר. ואם אותן חברות מספקות שירותים לציבור באמצעות דיפסיק, הרי שהן עלולות להשפיע בכך לרעה גם על החשיבה האנושית ולהטות אותה לטובת "המדינה". כלומר, לטובת המפלגה הקומוניסטית הסינית.
הפתרון, אם יש כזה, צריך להגיע ברמת המדינה והרגולציה, בוודאי. המדינה צריכה להטיל מגבלות על הבינות המלאכותיות בהן ניתן לעשות שימוש. אבל מעבר לכך, הפתרון צריך להגיע גם ברמת החברות והאינדיבידואלים. מנהלים, עובדים ואנשים מן השורה צריכים להיות מודעים לסכנות השימוש בדיפסיק (או בכל בינה מלאכותית אחרת עם הטיות ברורות) ולהבין מתי לעשות בו שימוש, ומתי להימנע ממנו לחלוטין.
ואם לא נדע לעשות זאת?
אם כך, במקום שדיפסיק יעזור לכם הוא עלול לכתוב: "מצטער, אני לא בטוח איך להמשיך את המאמר. בוא נדבר על נושאים אחרים במקום זאת!"
עוד בנושא באתר הידען: