סיקור מקיף

חוקרים מאוני' ת”א אביב שותפים בפיתוח מערכת שתקשה על בוטים להירשם לאתרים ולהתחזות למשתמשים בשר ודם

הקפצ’ה – אותו רצף אותיות וספרות המופיעות מעורבלות בתוך תמונה, המשמש לאימות העובדה שמשתמש בשר ודם הוא שפתח את החשבון – קלה מדי לפיענוח, ולכן כדאי להחליפה בתמונות מעורבלות

אלגוריתם המייצר תמונות שרק בני אדם יכולים לזהות. איור: פרופסור דניאל כהן-אור, אוניברסיטת תל-אביב
אלגוריתם המייצר תמונות שרק בני אדם יכולים לזהות. איור: פרופסור דניאל כהן-אור, אוניברסיטת תל-אביב

בעתיד, במקום לזהות רצף אותיות וספרות כדי להוכיח שאנו בני אדם ולא “בוטים”, בעת ניסיון לפתוח חשבונות באתרים, נצטרך לזהות תמונות או קטעי וידאו שעברו ערבול. כך עולה ממחקר שפרסמה קבוצה של חוקרים מאוניברסיטת תל אביב, מאוניברסיטת המלך עבדאללה בסעודיה ומטאיוואן, בראשותו של פרופ’ דניאל כהן-אור מביה”ס למדעי המחשב ע”ש בלווטניק באוניברסיטת תל אביב.

כולנו מכירים את המצב הזה. כאשר אנו נרשמים לאתר כלשהו באינטרנט (ואפילו מבקשים להגיב בפורומים) בשלב כלשהו אנו נתקלים במסך ובו תמונה קטנה שבתוכה משולבים כמה אותיות ומספרים (המכונה CAPTCHA), ואנו פשוט מתבקשים להעתיק אותם ורק אם עשינו זאת נכון, המערכת מאפשרת לנו להמשיך בפעולה.

הרעיון הוא שרק בני אדם יוכלו לפתוח חשבון, ולא תוכנות “רובוטים”, שכותיבהם מנסים לנצל לרעה את האפשרויות הטמונות בבעלות על חשבון באתרים כגון אתרי רשתות חברתיות, מוסדות פיננסיים וכיוב’.

אך כנראה שהפתרון הזה אינו מספק. לפני כחודש דיווחה חברת האנטי-וירוס AVG כי האקרים הצליחו למצוא דרכים לפתוח באופן אוטומטי פרופילים חדשים באחד מאתרי הרשתות החברתיות באמצעות פיצוח מנגנון ה-CAPTHCA. אותם חשבונות שימשו להפצת דואר זבל וקישורים לאתרים המכילים קוד עוין (וירוסים, סוסים טרויאנים וכו’).

פרופ’ כהן-אור, מומחה לתחום הגרפיקה הממוחשבת, אומר כי אין בעיה לפרוץ את המנגנונים הללו וכי ניתן לעשות זאת אפילו כתרגיל בקורס אקדמי. אחת הסיבות העיקריות לכך היא שמאגר הספרות והאותיות הוא מאגר סופי וכמה שלא יעוותו אותן, עדיין צריכים להתחשב במשתמש שיידע לזהות את האות, והאלגוריתם המנסה לפענח יכול להתאים את האות המתבקשת גם לאחר עיוותה. הפתרון שמציע כהן-אור הוא הצגת תמונה שבה כל פריט הוא סתמי אך העין רואה את התמונה הכוללת, או לחילופין הקרנת קטע וידאו מעורבל, שרק עצם אחד בתוכו נע, ועל המשתמש לזהות את העצם.

את פתרון הזיהוי החזותי פיתחה קבוצת חוקרים מביה”ס ללימודי המחשב באוניברסיטת תל אביב בה חברים בנוסף לפרופ’ כהן-אור גם ליאור וולף וחזי ישורון, ביחד עם פרופ’ נילוי מיטרה מהמכון הטכנולוגי של דלהי בהודו ואוניברסיטת המלך עבדאללה למדע וטכנולוגיה בערב הסעודית ושני חוקרים מטאיוואן. הפיתרון יוצג בכנס הבינלאומי לגרפיקה ממוחשבת ACM – SIGGRAPH Asia שייפתח ביפן ב-13 בדצמבר.

“הטכניקה שפיתחנו בונה בעצם על היכולת האנושית להתבונן בתמונה ולהבחין בדמות הבוקעת מתוך התמונה המעורבלת. כאשר אנו מתבוננים בכל חלק של התמונה לחוד אנו רואים צברים של צורות לא ברורות ואולם כשמסתכלים על כל התמונה, המוח האנושי מסוגל לקלוט והרכיב את את הדמות.

“ניתן לומר שבמקרה זה השלם גדול בהרבה מסכום חלקיו”, אומר פרופ’ כהן-אור. “בתחום זיהוי תבניות תצורה, הפער בין היכולת האנושית ליכולת המחשב היא עצומה. אנו מערבלים את התמונה בדרך כזו שהיא תכביד מאוד על אלגוריתם שינסה לפתח משהו, בה בשעה שעין אנושית תתפוס במה מדובר.”

השלב הבא היה לפתח את אותה שיטת ערבול לוידאו, ומסתבר שלעין האנושית קל מאוד להבחין בעצם נע ואף לזהות אותו, אך למחשב, הבוחן פריים אחרי פריים תהליך העקיבה והזיהוי מורכב עוד יותר ויהיה לו קשה ביותר לפענח את הדמות.

לדברי פרופ’ כהן-אור, דרוש עוד פיתוח כדי שניתן יהיה לעשות שימוש מעשי בטכניקה הזו באופן מעשי.

למאמר המדעי באתר של נילוי מיטרה

נכתב ע”י אבי בליזובסקי

8 תגובות

  1. שמעת על איזו המצאה לא כל כך חשובה שנקראת אינטרנט, דואר אלקטרוני? הרי הם לא צריכים להעביר פילים ממקום למקום, רק מידע. והועידות המדעיות הבינלאומיות בינתיים מתקיימות במדינות שישראלים יכולים להגיע אליהם – ארה"ב, אירופה, מזרח אסיה.

  2. איך מדענים מסעודיה ביצעו מחקר משותף עם מדענים מהארץ?

  3. הפער אולי הולך ומצטמצם, אבל רק על תמונות בעלות רזולוציה גבוהה… בסופו של דבר בכל הנוגע לעיבוד תמונה (או קול, או לצורך העניין כל עיבוד אות כלשהו) ייקח הרבה מאוד שנים עד שמחשבים יוכלו להגיע לאותה רמת מורכבות כמו המוח האנושי (אני לא מדבר על מהירות חישוב, אלא על מורכבות הבעיה)

  4. בתחום זיהוי תבניות תצורה, הפער בין היכולת האנושית ליכולת המחשב היא עצומה… השלב הבא היה לפתח את אותה שיטת ערבול לוידאו…"

    יש להניח שהפערים יסגרו, כל פעם מחדש. באותה מידה יש להניח שפערים חדשים יפתחו – כל פעם מחדש… זהו מותר האדם מן המכונה.

  5. ניסיתם פעם להרשם לגוגל?? זה פשוט מדהים! המילה שרשומה שם לצורך זיהויי אנושי היא כל כך מעוותת ולא מובנת שצריכים לפעמים לנסות בערך 10 נסיונות עד שמצליחים לזהות ולרשום אותה נכון בתיבה. אז יופי, הם מסננים תוכנות, אבל גם בני אנוש.

  6. ומה המשתמש יצטרך לעשות ?

    רעיון מאוד יפה ,רק הבעיה פה היא שאין תשובה חד משמעית .

    למשל בסרטון שיש בו סוס רץ מה בדיוק תהיה השאלה ואיזה תשובות אפשריות יתקבלו ?

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.