מחקר בבר אילן: האם כותב מאמר זה הוא גבר או אישה? המחשב יודע!

חוקרים מאוניברסיטת בר-אילן בנו תוכנת מחשב המאפשרת לזהות את מינו של סופר לא ידוע. הצלחת הזיהוי- חמש מתוך שש פעמים * המחקר יתפרסם בימים הקרובים בכתב עת בהוצאת אוניברסיטת אוקספורד

אבי בליזובסקי

קישור ישיר לדף זה: https://www.hayadan.org.il/aibarilan.html

חוקרים מאוניברסיטת בר-אילן הצליחו לבנות תוכנת מחשב אשר יכולה לזהות את מינו של כותב מאמר או ספר מסוים.
פרופ' משה קופל מהמחלקה למדעי המחשב שבאוניברסיטת בר-אילן ופרופ' שלמה ארגמן (השוהה כעת במכון הטכנולוגי של אילינוי-שיקגו), יחד עם הבלשן פרופ' ג'ונתן פיין (מהמחלקה לאנגלית שבאוניברסיטת בר-אילן) והסטודנטית ענת שמעוני, מדווחים כי שימוש נבון באותות לשוניים, מאפשר לזהות את מינו של כותב מאמר באנגלית, בשיעור הצלחה של חמישה מתוך ששה נסיונות.

הגילויים החדשים יתפרסמו השבוע בכתב העת Literary and Linguistic Computing, שיוצא בהוצאת אוניברסיטת אוקספורד.

טכניקות שונות מתחום של מדעי המחשב הידוע כ"למידת מכונה", משמשות לתכנות מחשב שיבחין בין דוגמאות כתיבה של גברים וכתיבה של נשים.
המחשב מתוכנת ללמוד בעצמו איך להבדיל בין כתיבות אלו בהתבסס על קביעות סטטיסטיות שהוא מוצא בדוגמאות. אחרי שהמחשב לומד מדוגמאות אלו, הוא מיישם את הדברים במסמכים אחרים שלא נראו לו קודם.

ספריהם של הסופרים כמו דבורה טנן וג'ון גריי הביאו לפופולריות רבה את הרעיון שלנשים ולגברים יש סגנון דיבורי שונה. הגילויים החדשים מראים שהבדלי המגדר מגיעים אפילו לסגנונות הכתיבה בספרים ומאמרים.
דבר זה מפתיע משום שלא כמו בהשתתפות בשיחה, בכתיבת ספרים ומאמרים אין כאן אינטראקציה חברתית ישירה.

המשך בעמ' 2…

המחקר בבר-אילן נעשה על כ- 600 ספרים ומאמרים שנלקחו מה- British National Corpus–אסופה גדולה של טקסטים כתובים שנאספו למטרת המחקר הלשונאי. החוקרים מצאו שאותם הבדלים בין סופרים משני המינים היו בכל הקשת הרחבה של הנושאים שנבדקו, כולל, אמנות, פוליטיקה, מדע, ביוגרפיות ועוד.
במאמר שיתפרסם בקיץ בכתב העת היוקרתי, Text, המחברים מראים שבכתיבת ספרות בדיונית ולא בדיונית, נשים משתמשות בכתיבתן במילים המסמנות את היחס בין כותב הספר לבין הקורא יותר מאשר גברים, בעוד גברים נוטים להשתמש במילים המתארות ומכמתות דברים יותר מאשר נשים. הסיבות להבדלים אלו עדיין לא ברורות.

שימוש פוטנציאלי אחד בממצאים אלו הוא בשטח הזיהוי הפלילי.
דונלד פוסטר ממכללת Vassar בארה"ב, מומחה לזיהוי סופרים אנונימיים, זיהה את הסופר ג'ו קליין ככותב הספר- Primary Colors, על ידי השוואת סגנון ספר זה בכתבים ידועים של אותו סופר.
אולם יש לזכור כי בדרך כלל, לחוקרים העוסקים באכיפה משפטית, אשר מנסים לזהות כותב אנונימי של מסמך כלשהוא, אין מבחר דוגמאות כתובות כפי שהיה לפוסטר.
במקרים אלו, החוקרים יסתפקו בהרכבת פרופיל הכותב על פי מינו, גילו, רקעו הלשונאי, החינוכי וכד'.
צוות החוקרים מבר-אילן אומר שהטכניקות האוטומטיות שהביאו לפתרון בעיית זיהוי מין הכותב האנונימי, יוכלו לשמש גם בזיהוי מאפיינים דמוגרפיים אחרים.

ידען רובוטיקה ותבונה מלאכותית
https://www.hayadan.org.il/BuildaGate4/general2/data_card.php?Cat=~~~500870851~~~207&SiteName=hayadan

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זו עושה שימוש ב-Akismet כדי לסנן תגובות זבל. פרטים נוספים אודות איך המידע מהתגובה שלך יעובד.