סיקור מקיף

38 מחטים בערמת שחת – פרק מתוך המותחן הטכנולוגי “ג’ונגל הסיליקון” מאת שומיט בלוג’ה

ספר חדש בהוצאת אחלמה * מותחן טכנולוגי * ג’ונגל הסיליקון מאת שומיט בלוג’ה * מאנגלית: ליאת פלן-לברטובסקי עריכה וייעוץ למהדורה העברית: אוהד רוזן

עטיפת הספר ג'ונגל הסיליקון \

אודות הספר

– מה קורה כשמתמחה צעיר ונאיבי מקבל גישה חופשית ובלתי מוגבלת למחשבות ולפעולות הפרטיות ביותר שלנו? סטיבן ת’ורפ זוכה במשרת התמחות נחשקת באובטו, אימפריית אינטרנט המספקת למשתמשיה שירותים מקוונים רבים, החל ממנוע חיפוש ואתר קניות וכלה בחשבון אימייל ורשת חברתית. כאשר הבוס שלו מבקש ממנו לעבוד על פרויקט עבור הקואליציה האמריקאית לזכויות האזרח, הוא מתגייס למשימה בתום לב, אבל מכאן, הכול רק הולך ומסתבך. סטיבן נקלע בעל כורחו למרדף מסחרר שבמהלכו צצים על פני השטח אנשי היי-טק תאבי בצע, פעילים איסלאמיים קיצוניים וסוכני ביון ממשלתיים, שכולם נחושים להשיג גישה למאגרי המידע הרגישים ביותר של החברה.
גו’נגל הסיליקון הוא מותחן טכנולוגי סוחף, המתאר את המתרחש בחברת ענק פורצת דרך וחסרת מתחרים בתחום כריית המידע, המחזיקה בכספות הנתונים העצומות שלה את מאגר התשוקות, הסודות ונקודות התורפה האינטימיות ביותר של כל משתמשיה. הספר נכתב על ידי ד”ר שומיט בלוג’ה, חוקר בכיר בגוגל שמכיר את המערכת לפני ולפנים – את היתרונות האינסופיים הגלומים בה, כמו גם את הסכנות המצמררות הכרוכות בניצולה לרעה על ידי גורמים בעלי עניין.

ג’ונגל הסיליקון מעלה תהיות אתיות משמעותיות אודות הקלות שבה ניתן לנצל את הפעולות המקוונות שכולנו עושים לצרכים פוליטיים, ביטחוניים ואישיים ולחבר את פיסות המידע הקטנות ביותר שאנחנו חושפים על עצמנו מבלי משים לפרופיל מתוחכם של ההרגלים, המטרות והמאוויים הכמוסים ביותר שלנו, שניתן לנצלו בדרכים העולות על כל דמיון. ואכן, עם צאתו לאור, בשנת 2011, עורר הספר הדים רבים בארה”ב וזכה לביקורות נלהבות.
ד”ר שומיט בלוג’ה הוא מדען וחוקר בכיר בחברת גוגל, דוקטור למדעי המחשב וחבר הסגל האקדמי במחלקה למדעי המחשב ובמכון לרובוטיקה של אוניברסיטת קרנגי מלון. בעבר, שימש כראש חטיבת הטכנולוגיה בחברת ג’מדט מובייל וכמדען הראשי של חברת לייקוס.

עשרות מאמרים אקדמיים נכתבו על הסכנות הפוטנציאליות לפגיעה בפרטיות, הטמונות באינטרנט. ג’ונגל הסיליקון מציג את הסכנות לא כאיום תיאורטי וכסכנה ערטילאית, אלא באופן אמיתי, מוחשי וקרוב מתמיד, כך שירתק כל אחד שגולש באינטרנט ואינו מתאר לעצמו מי יושב מאחורי המסך.

להלן הפרק 38 מחטים בערמת שחת

מרץ 2009.

מסך המחשב התעורר לחיים. סטיבן כבר לא שמע את לין או את האנשים האחרים שהיו איתו בחדר. הוא נמצא מתאים לקבוצת כריית המידע וכעת, הוא התבונן בתשומת לב במסך שלפניו וניסה לפענח את המשימה שניתנה לו:

משימת כריית מידע 1: חיזוי העתיד

אובטו שואפת להכיר את המשתמשים שלה טוב יותר מכולם. בשנה שעברה השקנו סדרה של טלפונים ניידים. כדי לעזור למשתמשים שלנו, היינו רוצים לחזות מראש מה הם עומדים לחפש, עוד לפני שהם מקלידים את מילות החיפוש. עד כמה אתם טובים בחיזוי העתיד? תכננו וקדדו מערכת שתנבא מה יהיה החיפוש הבא של המשתמשים.

יש לכם גישה לכל הנתונים שלנו מהחודש האחרון – כל מילות החיפוש ש-50,000 משתמשים הקלידו בטלפונים הניידים שלהם. הפרטים אודות כל חיפוש כוללים את מיקום המשתמש בעת החיפוש, השעה שבה בוצעה הפעולה והמילים המדויקות שהוקלדו.

המשימה: באמצעות ניתוח הרישומים המצורפים וכל מידע
אחר שתוכלו למצוא, עליכם לחזות מראש את עשרת החיפושים הבאים של כל 50,000 המשתמשים. הניקוד יחושב על פי מספר ההתאמות בין התחזיות שלכם לבין החיפושים שבוצעו במציאות. הזמן המומלץ למשימה: לא יותר מ-4 שעות.

v

משימה כגון זו היתה בוודאי נראית לו קלה יותר בתקופת לימודיו האקדמיים, אך השנתיים וחצי האחרונות שבהן הוא עסק בחיבור מקלדות ותיקון מכשירי פקס לא תרמו במאום למוכנות שלו לתחרות. נחמתו היחידה היתה העובדה שהוא ידע שזו משימה אפשרית, אחרת, הם לא היו מקבלים אותה. או, לפחות, כך הוא קיווה. הוא לא הוטרד ממספר המשתמשים הגבוה. אם הוא יצליח לחזות במדויק את שאלות החיפוש הבאות של משתמש יחיד, הוא יוכל לעשות זאת גם לגבי כל האחרים. הבעיה היתה לפתח את האלגוריתם שיאפשר לו לנבא את החיזוי המדויק הראשון הזה. כל התשובות נמצאות ברישומי ההיסטוריה של החיפושים. כל שעליו לעשות הוא למצוא את הדרך לדלות את המידע הנכון מהם, ולעשות זאת תוך פחות מארבע שעות.

נתחיל עם העובדות הבסיסיות. הוא נזכר בתקופת לימודיו, בקורס “מבוא לבינה מלאכותית”. כדי לחזות מראש מה יהיה הצעד הבא של משתמש כלשהו, יש למצוא משתמשים אחרים שדומים לו ולבדוק מה הם עשו בנסיבות דומות. במילים אחרות, הוא פשוט צריך למצוא התאמה בין כל אחד מ-50,000 המשתמשים לבין משתמשים אחרים שביצעו חיפושים זהים. סביר להניח שבדיקת המשתמשים הדומים תצביע על תחומי עניין נוספים שמשותפים להם וחיפושים אחרים שהם עשויים לבצע. אחרי שהרעיון עלה במוחו, הוא לא התקשה לכתוב את התוכנה. הוא סיים תוך פחות משעה. הוא בדק כמה מהתחזיות שלו. חלקן נראו לו הגיוניות, אך רובן היו לדעתו מופרכות. לרגע, הוא נתקף פאניקה. הוא שקל את האפשרות לתקן את כל התוכנה באופן ידני, אך לאחר שהוא תיקן פחות מעשר תחזיות, הוא הבין בוודאות את מה שהוא ידע כל הזמן. היתה סיבה לכך שהם ביקשו מהמועמדים לנבא את חיפושיהם של 50,000 משתמשים – הם רצו לוודא שגישה ידנית תוביל למבוי סתום.

הוא קם ממקומו כדי לקחת משהו לשתות והתבונן סביבו בפעם הראשונה. היתה זו סצנה שהוא לא היה חלק ממנה כבר שנים – האנשים סביבו עבדו בקדחתנות, כשהם מתעלמים לחלוטין מסביבתם, וכולם היו שם מרצונם החופשי, ולא בגלל שמישהו הכריח אותם לבוא. הוא חיפש את הסימנים המסגירים של לחץ נפשי – אנשים שטומנים את ראשם בין ידיהם או נשענים אחורנית על הכיסא – אך לא הבחין בשום דבר כזה. יתכן שהשעה פשוט היתה מוקדמת מדי. האמת היתה שהוא קיווה לראות סדקים רבים יותר בחומת המתחרים.

הוא התיישב והתבונן שוב במסך שלפניו, שכבר היה מלא בקוד תוכנה צפוף ומבולבל, פרי עבודתו בשעה האחרונה. הקוד נראה מכוער ולא הגיוני והוא כמעט התבייש בו. הוא ידע שהמרצים שלו בקולג’ היו שוללים לו את התואר אילו הם היו רואים אותו. מצד שני, הוא גם ידע שאף אחד מהם לא היה מצליח להתקבל לאובטו. אסור היה לו להמשיך לחשוב על כך. המחשבות הסיחו את דעתו והוא היה חייב להפסיק. הוא שינה את דעתו בקשר לשתייה והתיישב בחזרה במקומו. הוא הניח את ידיו על המקלדת, הקפיץ את אצבעותיו על המקשים וניסה לחשוב ברצינות מה לעשות הלאה.

כמו שנראה תמיד במבט לאחור, כאשר ההארה הגיעה, היא היתה ברורה מאליה. העובדה שהמשתמשים חיפשו מידע באמצעות הטלפונים הסלולריים שלהם העידה על חשיבותו של מיקומם הגיאוגרפי. אנשים מחפשים מידע אודות נושאים שחשובים להם. אם הם משתמשים בטלפון נייד, סימן שהם מחוץ לבית או בנסיעה, ובתנאים אלה, קרוב לוודאי שהמיקום שלהם חשוב להם. הניסיון מראה שאם אתה נמצא בקליפורניה, סביר יותר להניח שתחפש מידע על מסעדות סושי, בהשוואה למישהו שנמצא בנברסקה. כעת המשימה נהיתה קלה יותר, שכן, לאובטו היו נתונים אודות מיקומו של כל משתמש. כשסטיבן חיפש משתמשים שהיו דומים זה לזה, הוא הוסיף את המיקום לפרופיל המשוער (לדוגמה, הגורם המשותף היחיד לג’יין וג’ון עשוי להיות מיקום גיאוגרפי דומה).

לאחר שתי הפסקות קפה וחטיף, הוא הרגיש שמה שהוא עשה צריך להספיק כדי לשפר את תשובותיו בצורה משמעותית. הוא כבר היה באיחור של ארבעים וחמש דקות. השעה היתה 14:45. הוא ניסה את התוכנה המשופרת על כמה מתוך 50,000 המשתתפים. התוצאות נראו טוב יותר מהגרסה הראשונית. הוא אפשר לתוכנה לעבד את הנתונים של כל המשתתפים ונמנע מלהסתכל בתשובות שהופיעו על המסך. הוא פחד שהוא לא יוכל לעמוד בפיתוי לשפר אותה עוד קצת, כי הזמן שעמד לרשותו הלך ואזל. ברגע שהתשובות התקבלו, הוא שלח אותן לבדיקה ועצר את נשימתו. עוד לפני שהוא הספיק להישען לאחור על הכסא, הופיעה הודעה על המסך:

ברכותינו. משימה 1 הושלמה בהצלחה. למשימה 2, לחץ על אחד המקשים.

סטיבן הופתע לגלות עד כמה הוא שמח. בהשוואה למשימות שהיה עליו לבצע בתור מנהל חברה עצמאית, היתה זו מטלה קטנה בהיקפה. אולם למרות זאת, המחשבה על עבודה באובטו, שתאפשר לו גישה חופשית לכל מה שיש לחברה הזו להציע (לא שהוא ידע בדיוק מה היקף הנתונים העומדים לרשותה, הוא ידע רק שמדובר בכמות עצומה) גרמה לו להתרגשות. הוא הרגיש כמעט מסוחרר. אבל עוד יהיה לו מספיק זמן להתרגש מאוחר יותר. משימה 2 כבר המתינה לו על המסך שלפניו.

משימת כריית מידע 2

מתוך 100,000 משתתפים שסוננו מראש כדי שיתאימו לפרופיל שחיפשנו, 78 קנו מכונית שעלתה יותר מ-161,000 דולר. שמותיהם של 40 מהם יופיעו בהמשך ומשימתכם היא לגלות מיהם ה-38 הנותרים.

תקבלו גישה למיילים שהם שלחו במהלך השנה האחרונה באמצעות אובמייל, לריכוז הרכישות שלהם בשירות האשראי שלנו ולמיקוד שלהם. בנוסף, תקבלו גישה לכל החיפושים שהם ביצעו במנוע החיפוש של אובטו בשנה האחרונה.

הזמן המומלץ לביצוע המשימה הוא 12 שעות. אנחנו ממליצים לכם בחום להיעזר במקורות מידע חיצוניים כדי להשלים את המטלה. כל מקורות המידע האפשריים מותרים לשימוש.

v

שתים עשרה השעות יסתיימו בשלוש לפנות בוקר. היתה זו משימה מורכבת, לא רק בגלל הזמן הרב שהוקצב לה, אלא בגלל הנתונים שהמועמדים הורשו לראות: מיילים, מספרי מיקוד ורכישות בכרטיסי אשראי. זו היתה הדרך שבה אובטו הרוויחה כסף – היא הבינה את המשתמשים שלה וידעה מה וכיצד למכור להם. למרות שהיא סיפקה למשתמשיה מספר עצום של שירותים, היא היתה, למעשה, חברת פרסום – מכונת פרסום עקשנית, יעילה ובלתי מתפשרת.

כשסטיבן התבונן סביבו, הוא שם לב שמחצית מהכיסאות היו ריקים. יתכן שכולם יצאו להפסקה. הוא יצא כדי להביא אוכל, אך לא שמע סביבו את אלה שהיו אמורים להיות שם. “איפה כולם?” הוא שאל את המועמד הראשון שהוא פגש ליד המזנון. הבחור שלצדו נעצר ליד המנות הראשונות, כשהוא מנסה להחליט מה לקחת – סלמון או נתחי בשר תאו.

“אני לא יודע,” הוא השיב, “אני חושב שרובם לא הצליחו לעבור לשלב הבא.”

“אה,” ענה סטיבן. הוא לא היה מסוגל לחשוב על משהו חכם יותר להגיד.

“בקבוצה שלי, קריפטוגרפיה, מסתובבת שמועה שמחצית מהמועמדים כבר עפו הביתה.” בסופו של דבר, הוא החליט שלא להחליט וערם על צלחתו מנה נדיבה של סלמון ובשר ביחד. “לאיזו קבוצה אתה שייך?”

“כריית מידע. בדיוק התחלתי את השאלה השנייה.”

“מקווה שתצליח. אני חייב לרוץ. יש לי עוד הרבה עבודה,” אמר האכלן הלא-החלטי שלידו ומיהר לחזור למקומו, תוך שהוא מרחרח בהנאה את הצלחת שלו.

סטיבן ישב ליד שולחן ריק וניסה לאכול לאט ולשכנע את עצמו שהוא זקוק למנוחה של רבע שעה, שבסופו של דבר, רק תועיל לו. הוא לא הצליח. הוא בלע את האוכל תוך פחות משלוש דקות, שרף את השפתיים והלשון בלגימת קפה רותח וחזר כמעט בריצה למחשב שלו.

אחרי שהוא התיישב, הוא הרגיש מטופש בגלל הריצה הזו. הבעיה עדיין נותרה בלתי פתירה, בדיוק כמו מקודם. אומרים שלא קל למצוא מחט בערמת שחת, אבל המשימה שלו היתה אפילו קשה יותר – היה עליו למצוא 38 איש מתוך 100,000. 38 מחטים. הוא בהה במסך שלפניו. הוראות המשימה השנייה עדיין ריצדו שם, ללא שינוי ניכר.

סטיבן דחף את המקלדת לאחור, הניח את מרפקיו על השולחן והשעין את ראשו על כפות ידיו. הוא לא טרח לפקוח את עיניו. התחל במה שאתה כבר יודע.

אוקיי. ראשית, הוא ידע שאפשר לבצע את המשימה הזו. המידע היה נגיש וזמין. הוא היה שם, ממש בקצות אצבעותיו. מספרי מיקוד, מיילים, הרגלי צריכה. מה מגלים מספרי המיקוד? לעיתים, הרבה: המצב הכלכלי של המשתמש, איזה סוג של בית מצוי בבעלותו. כל המידע הזה היה זמין לכלל הציבור ברשת. הלשכה לסטטיסטיקה אוספת את כל הנתונים האלה, ויותר. בעצם, הוא גם ידע שהוא יכול להשמיט את כל מי שקנה בגרינסמארט לעיתים קרובות מדי. כבר הרבה זמן שהוא לא ראה במגרש החניה שלהם מכונית בשווי של 161,000 דולר. אבל מה לגבי הדפוסים המשותפים האחרים? הוא יכול היה להשמיט גם את כל מי שמגיע בעצמו לרשתות השיווק או קונה בחנויות זולות כמו “הכל בדולר”. כל הנתונים האלה הופיעו בפירוט הרכישות בכרטיסי האשראי ובאמצעי התשלום של אובטו והיו זמינים למשתתפי התחרות.

מה עוד עשוי להצביע על כך שהמשתמש יקנה מכונית יקרה? מקום העבודה שלו? יתכן. הוא מצא גם מתאם משמעותי למספרי המיקוד. מה עוד? מה עשוי היה לשכנע אותו לקנות מכונית יקרה כל כך? הוא תהה. שום דבר, בעצם. אבל אולי החברים שלו היו מנסים לשכנע אותו. אלו חברים? אלה שקנו מכוניות משגעות בעצמם? כן. אילו הוא היה הטיפוס שהיה קונה מכונית ב-161,000 דולר, יתכן שהוא היה מנסה לשכנע את חבריו לקנות גם הם מכונית כזו. או לפחות, היה מספר להם עליה. סביר להניח שחלק מהשיחות ביניהם היו מתנהלות באמצעות מיילים. ומה לגבי תמונות של המכונית? זה עשוי לעזור. ואם הוא היה שוקל לרכוש מכונית יקרה, האם לא יהיה זה סביר להניח שהוא יחפש עליה מידע ברשת? בוודאי שכן.

הגיע הזמן לעשות עבודת שטח יסודית. הוא צריך למצוא אלו מכוניות עולות למעלה מ-161,000 דולר. ידוע לו ש-40 איש קנו אותן. מי החברים שלהם? הוא צריך לקרוא את המיילים שלהם ולבדוק למי הם סיפרו על הרכישה. מי אלה שגם חיפשו מידע על המכוניות היקרות? יש לו את שמות המכוניות וכעת, יש לו גם את קבוצת החברים הפוטנציאלית שקנתה אותן. הוא יודע היכן הם גרים ומה השווי המוערך של בתיהם. את הנתונים האלה הוא קיבל מרישומי הלשכה לסטטיסטיקה ומבדיקה שטחית של מספר אתרי נדל”ן. האם יתכן שהמשימה קלה כל כך לפתרון?

סטיבן שקע במחשבות. הוא היה חסר תנועה בצורה כמעט בלתי אנושית, מלבד תנועות העיניים המהירות שמתחת לעפעפיו הסגורים. חוסר התנועה הזה הסתיר את הפעילות הסוערת שהתרחשה במוחו. המחשבות התרוצצו שם במשחק מסחרר של תווים, כשהן חולפות במהירות דרך שדות מוקשים של מידע מטעה ואינספור נתונים שמחייבים ניתוח, כדי לחשוף, בסופו של דבר, את 38 האנשים הנותרים. נותרו אחת עשרה שעות.

תגובה אחת

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.