הידען > ביולוגיה ורפואה > המוח > החושים > חוקרים מאוני' ת”א אביב שותפים בפיתוח מערכת שתקשה על בוטים להירשם לאתרים ולהתחזות למשתמשים בשר ודם

חוקרים מאוני' ת"א אביב שותפים בפיתוח מערכת שתקשה על בוטים להירשם לאתרים ולהתחזות למשתמשים בשר ודם

הקפצ'ה – אותו רצף אותיות וספרות המופיעות מעורבלות בתוך תמונה, המשמש לאימות העובדה שמשתמש בשר ודם הוא שפתח את החשבון – קלה מדי לפיענוח, ולכן כדאי להחליפה בתמונות מעורבלות

אלגוריתם המייצר תמונות שרק בני אדם יכולים לזהות. איור: פרופסור דניאל כהן-אור, אוניברסיטת תל-אביב

בעתיד, במקום לזהות רצף אותיות וספרות כדי להוכיח שאנו בני אדם ולא "בוטים", בעת ניסיון לפתוח חשבונות באתרים, נצטרך לזהות תמונות או קטעי וידאו שעברו ערבול. כך עולה ממחקר שפרסמה קבוצה של חוקרים מאוניברסיטת תל אביב, מאוניברסיטת המלך עבדאללה בסעודיה ומטאיוואן, בראשותו של פרופ' דניאל כהן-אור מביה"ס למדעי המחשב ע"ש בלווטניק באוניברסיטת תל אביב.

כולנו מכירים את המצב הזה. כאשר אנו נרשמים לאתר כלשהו באינטרנט (ואפילו מבקשים להגיב בפורומים) בשלב כלשהו אנו נתקלים במסך ובו תמונה קטנה שבתוכה משולבים כמה אותיות ומספרים (המכונה CAPTCHA), ואנו פשוט מתבקשים להעתיק אותם ורק אם עשינו זאת נכון, המערכת מאפשרת לנו להמשיך בפעולה.

הרעיון הוא שרק בני אדם יוכלו לפתוח חשבון, ולא תוכנות "רובוטים", שכותיבהם מנסים לנצל לרעה את האפשרויות הטמונות בבעלות על חשבון באתרים כגון אתרי רשתות חברתיות, מוסדות פיננסיים וכיוב'.

אך כנראה שהפתרון הזה אינו מספק. לפני כחודש דיווחה חברת האנטי-וירוס AVG כי האקרים הצליחו למצוא דרכים לפתוח באופן אוטומטי פרופילים חדשים באחד מאתרי הרשתות החברתיות באמצעות פיצוח מנגנון ה-CAPTHCA. אותם חשבונות שימשו להפצת דואר זבל וקישורים לאתרים המכילים קוד עוין (וירוסים, סוסים טרויאנים וכו').

פרופ' כהן-אור, מומחה לתחום הגרפיקה הממוחשבת, אומר כי אין בעיה לפרוץ את המנגנונים הללו וכי ניתן לעשות זאת אפילו כתרגיל בקורס אקדמי. אחת הסיבות העיקריות לכך היא שמאגר הספרות והאותיות הוא מאגר סופי וכמה שלא יעוותו אותן, עדיין צריכים להתחשב במשתמש שיידע לזהות את האות, והאלגוריתם המנסה לפענח יכול להתאים את האות המתבקשת גם לאחר עיוותה. הפתרון שמציע כהן-אור הוא הצגת תמונה שבה כל פריט הוא סתמי אך העין רואה את התמונה הכוללת, או לחילופין הקרנת קטע וידאו מעורבל, שרק עצם אחד בתוכו נע, ועל המשתמש לזהות את העצם.

את פתרון הזיהוי החזותי פיתחה קבוצת חוקרים מביה"ס ללימודי המחשב באוניברסיטת תל אביב בה חברים בנוסף לפרופ' כהן-אור גם ליאור וולף וחזי ישורון, ביחד עם פרופ' נילוי מיטרה מהמכון הטכנולוגי של דלהי בהודו ואוניברסיטת המלך עבדאללה למדע וטכנולוגיה בערב הסעודית ושני חוקרים מטאיוואן. הפיתרון יוצג בכנס הבינלאומי לגרפיקה ממוחשבת ACM – SIGGRAPH Asia שייפתח ביפן ב-13 בדצמבר.

"הטכניקה שפיתחנו בונה בעצם על היכולת האנושית להתבונן בתמונה ולהבחין בדמות הבוקעת מתוך התמונה המעורבלת. כאשר אנו מתבוננים בכל חלק של התמונה לחוד אנו רואים צברים של צורות לא ברורות ואולם כשמסתכלים על כל התמונה, המוח האנושי מסוגל לקלוט והרכיב את את הדמות.

"ניתן לומר שבמקרה זה השלם גדול בהרבה מסכום חלקיו", אומר פרופ' כהן-אור. "בתחום זיהוי תבניות תצורה, הפער בין היכולת האנושית ליכולת המחשב היא עצומה. אנו מערבלים את התמונה בדרך כזו שהיא תכביד מאוד על אלגוריתם שינסה לפתח משהו, בה בשעה שעין אנושית תתפוס במה מדובר."

השלב הבא היה לפתח את אותה שיטת ערבול לוידאו, ומסתבר שלעין האנושית קל מאוד להבחין בעצם נע ואף לזהות אותו, אך למחשב, הבוחן פריים אחרי פריים תהליך העקיבה והזיהוי מורכב עוד יותר ויהיה לו קשה ביותר לפענח את הדמות.

לדברי פרופ' כהן-אור, דרוש עוד פיתוח כדי שניתן יהיה לעשות שימוש מעשי בטכניקה הזו באופן מעשי.

למאמר המדעי באתר של נילוי מיטרה

נכתב ע"י אבי בליזובסקי

קטגוריות: החושים, טכנולוגית מיחשוב
תגיות: אוניברסיטת תל אביב, דניאל כהן-אור, החושים, ראיה

אוניברסיטת תל אביב

לכל הכתבות של המחבר

8 תגובות

ג'אם הגיב:

29 בדצמבר 2009 בשעה 23:00

תיקון קטן וקטנוני..
זה CAPTCHA
(ולא CAPTHCHA)
ראשי תיבות של:Completely Automated Public Turing test to tell Computers and Humans Apart

http://en.wikipedia.org/wiki/CAPTCHA
אבי בליזובסקי הגיב:

17 בדצמבר 2009 בשעה 15:15

שמעת על איזו המצאה לא כל כך חשובה שנקראת אינטרנט, דואר אלקטרוני? הרי הם לא צריכים להעביר פילים ממקום למקום, רק מידע. והועידות המדעיות הבינלאומיות בינתיים מתקיימות במדינות שישראלים יכולים להגיע אליהם – ארה"ב, אירופה, מזרח אסיה.
משתמש אנונימי (לא מזוהה) הגיב:

17 בדצמבר 2009 בשעה 14:47

איך מדענים מסעודיה ביצעו מחקר משותף עם מדענים מהארץ?
בוב הגיב:

16 בדצמבר 2009 בשעה 11:07

הפער אולי הולך ומצטמצם, אבל רק על תמונות בעלות רזולוציה גבוהה… בסופו של דבר בכל הנוגע לעיבוד תמונה (או קול, או לצורך העניין כל עיבוד אות כלשהו) ייקח הרבה מאוד שנים עד שמחשבים יוכלו להגיע לאותה רמת מורכבות כמו המוח האנושי (אני לא מדבר על מהירות חישוב, אלא על מורכבות הבעיה)
אבי הגיב:

15 בדצמבר 2009 בשעה 10:07

למגיב 3 הפער הזה הולך ומצתמצם במהירות –

http://www.ynet.co.il/articles/0,7340,L-3445800,00.html
אדי הגיב:

15 בדצמבר 2009 בשעה 00:28

בתחום זיהוי תבניות תצורה, הפער בין היכולת האנושית ליכולת המחשב היא עצומה… השלב הבא היה לפתח את אותה שיטת ערבול לוידאו…"

יש להניח שהפערים יסגרו, כל פעם מחדש. באותה מידה יש להניח שפערים חדשים יפתחו – כל פעם מחדש… זהו מותר האדם מן המכונה.
ירון הגיב:

14 בדצמבר 2009 בשעה 21:40

ניסיתם פעם להרשם לגוגל?? זה פשוט מדהים! המילה שרשומה שם לצורך זיהויי אנושי היא כל כך מעוותת ולא מובנת שצריכים לפעמים לנסות בערך 10 נסיונות עד שמצליחים לזהות ולרשום אותה נכון בתיבה. אז יופי, הם מסננים תוכנות, אבל גם בני אנוש.
עמית הגיב:

14 בדצמבר 2009 בשעה 21:32

ומה המשתמש יצטרך לעשות ?

רעיון מאוד יפה ,רק הבעיה פה היא שאין תשובה חד משמעית .

למשל בסרטון שיש בו סוס רץ מה בדיוק תהיה השאלה ואיזה תשובות אפשריות יתקבלו ?

כתיבת תגובה

אתר זו עושה שימוש ב-Akismet כדי לסנן תגובות זבל. פרטים נוספים אודות איך המידע מהתגובה שלך יעובד.