סיקור מקיף

מערכת ראשונה מסוגה לזיהוי כתב יד ערבי בזמן-אמת פותחה באוניברסיטת בן-גוריון

לפיתוח החדשני השלכה מרחיקת-לכת על כמיליארד בני אדם

חוקרים באוניברסיטת בן-גוריון בנגב הצליחו לפתח מערכת ראשונה מסוגה לזיהוי כתב יד ערבי בזמן-אמת ברמת דיוק גבוהה מאד- כ-97%. המערכת מאפשרת למשתמש לכתוב בעט על לוח אלקטרוני, המזין את כתב-היד למחשב, שמנתח ומתרגם אותו לאותיות מודפסות באלפית השניה. הפיתוח נרשם באחרונה כפטנט.

החוקרים, ד"ר גיהאד אל-סאנע והסטודנט שלו לתואר שני (מסטר) פאדי ביאדסה מהמחלקה למדעי המחשב באוניברסיטה, פיתחו את המערכת על בסיס מחקר המבוסס על שיטות מתקדמות של למידה, תוך שימוש בגיאומטריה חישובית לניתוח העקומות, הלולאות והנקודות שבונה מודל הסתברותי של זיהוי. המערכת מזהה כתב-יד ממוצע ובנויה ללמוד כתבי יד חדשים במהלך הכתיבה.

עכבר ומקלדת הם ההתקנים השכיחים ביותר להעברת אינפורמציה טקסטואלית למחשב. התפתחות של מחשבי כף-יד ומחשבי הלוח האישיים, המאפשרים כתיבה בכתב יד על לוח קטן, מחייבת שיטות חדשות לזיהוי כתב-יד ותרגומו לטקסט מודפס במחשב.

ד"ר אל סאנע: "כאשר השימוש במחשב הופך להיות מרכיב חשוב במתן שירות לאזרח, יש יתרון עצום לשימוש בכתב יד במקום בהקלדה, בעיקר במדינות מתפתחות. קיימות כיום מערכות לזיהוי כתב-יד לטיני באחוזים טובים, אבל אין כל מערכת מעשית לזיהוי כתב-יד ערבי, העשויה לשמש כששית מתושבי כדור הארץ. זיהוי כתב-יד ערבי הינו בעיה קשה, מאחר שכתב זה מחובר באופן טבעי ומשום שרוב האותיות הערביות מכילות נקודות שממוקמות מעל או מתחת לאות. יודגש, שאנו מתחייבים לאותה צורה של כתיבה טבעית ללא שינוי. למשל בחלק ממחשבי כף-היד, אפילו לאותיות הלטינית יש שינוי קטן באותיות, כדי שיהיה אפשר לזהותם בצורה מהירה וללא שגיאות".

באשר לפוטנציאל הכלכלי של הפיתוח, אמר ד"ר אל סאנע: "מדובר באוכלוסיית יעד של כמיליארד בני אדם הדוברים את השפה הערבית, שפת האורדו (פקיסטן) וכורדית, שעשויים להיות משתמשים פוטנציאליים של הפיתוח. מבחינתנו-השמיים הם הגבול".חברת היישום של אוניברסיטת בן-גוריון, ב.ג. נגב טכנולוגיות, פועלת בימים לאיתור השקעות בפרויקט.

תגובה אחת

כתיבת תגובה

האימייל לא יוצג באתר.

דילוג לתוכן