סיקור מקיף

מדברים מהשטח

מהפיכת זיהוי הדיבור האוטומטי ASR (Automatic Speech Recognition) כבר כאן. בזירה בה הסרת מגבלות רגולציה ותחרות גוברת והולכת בין מפעילי טלקום וספקי שירותים, מביאות לחיפוש מתמיד ועקשני אחר שירותים בעלי ערך מוסף, נוצרה הזדמנות של ממש לטכנולוגיה החדשה

ד”ר עמי מויאל, מנכ”ל, NSC

קישור ישיר לדף זה: https://www.hayadan.org.il/nscdibur.html

בזירה העסקית של ימינו, בה הסרת מגבלות רגולציה ותחרות גוברת והולכת בין מפעילי טלקום וספקי שירותים, מביאות לחיפוש מתמיד ועקשני אחר שירותים בעלי ערך מוסף, נוצרה הזדמנות של ממש לטכנולוגיה חדשה יחסית – זיהוי הדיבור האוטומטי – ASR. מדובר בטכנולוגיה המאפשרת למכונה שבלב מערכת שירותי הטלפוניה לקבל מידע והנחיות מהמתקשר באמצעות קולו, ללא צורך בהקשה על מקשים. באמצעות שיחה טבעית בין המתקשר למכונה יכול הלקוח לקבל את המידע שביקש מיד, ללא שיטוט בתפריטים, ואפילו בלי צורך להמתין לנציג אנושי.

חברת המחקר גרטנר מעריכה שמכירות ערוצי זיהוי הדיבור בלבד יגיעו להיקף של 130 מיליון דולר ב- 2003. לכך כמובן יש להוסיף את השירותים המסופקים, את המכירות של מפתחי האפליקציות ואת ההכנסות של החברות המספקות שירותים. לטענת האנליסטים בחברה, שוק זיהוי הדיבור מתייצב והוא לקראת צמיחה.

ניתן להבחין כיום בשוק בשתי קטגוריות בסיסיות של יישומי ASR, המניעים את צמיחתו: שירותי ערך מוסף ומרכזי שירות לקוחות.

שירותי הערך המוסף כוללים טווח שירותים רחב, אותו ניתן להטמיע הן כשירות בודד והן במסגרת חבילת שירותים:
– (Voice Activated Dialing) VAD – חיוג למספר על ידי אמירת שם הצד אליו מתקשרים, או על ידי אמירת המספר עצמו. כן מאפשרת הטכנולוגיה אמירת משפטים כמו “התקשר למשה הביתה בבקשה” ולא רק את שם האדם בלבד. זהו שירות היכול שלו ערך רב בנסיעה למשל. בטכנולוגיה של היום אין צורך לאמן בקול את מילון השמות האישי והוא יכול להטען טקסטואלית ממקורות שונים כגון WEB או בעקבות המרת ספר הכתובות מה- PC שבמשרד.
– דואר קולי נשלט קול ומסרים מאוחדים – היכולת להאזין, לשלוח, למחוק, לשמור, להעביר הלאה ולנהל את תיבת ההודעות הקוליות האישיות באמצעות ממשק קולי. בעתיד תתבצע ההרחבה לכיוון הודעות דואר אלקטרוני ופקס.
– “פורטל קולי” – גישה לשירותים בהם ניתן להגדיר פרופיל אישי, דוגמת גישה קולית לחדשות, ספורט, מצב מניות, דיווחי תנועה וכד'.
– ניהול זמן – דוגמת תזכורות, משימות ופגישות – והכל באמצעות הקול.

יישומי מרכזי שירות לקוחות כוללים תמיכה במגוון תחומים בהם ישנה תקשורת אדם-מכונה או תקשורת אדם לאדם, שניתן להמירה באופן מלא או חלקי לתקשורת אדם-מכונה מבוססת ממשק קולי, כדוגמת הזמנת כרטיסים, שירותים פיננסיים, בריאות, גישה לתכנים, שירותים מבוססי מיקום וכד'.

עבור מפעילי הטלקום, היישום המובהק מתחיל עם שירותי VAD, גישה לשירותי מידע ונמשך עם ניהול קולי של דואר קולי. בשלב מאוחר יותר ניתן יהיה להוסיף שירותי מסרים מאוחדים ושירותי מידע נוספים. שירותי VAD ושירותי מידע הופעלו על ידי מרבית המפעילים הסלולריים הגדולים בארה”ב.

מפגינים בשלות

יישומי טלפוניה מבוססי ASR הופכים ליותר ויותר נפוצים בשוק, כשהם מפגינים בשלות. מצב זה הוביל את האנליסטים הסוקרים את התחום להסכים פה אחד כי צפוי גידול מרשים ביותר הן בתחום שירותי ערך מוסף מבוססי ממשק קולי למנוי הטלפוניה והן בתחום שירותי מערכות המענה הקולי לקהל הרחב. בין הסיבות שניתן למנות לגידול, בולטות במיוחד הבאות: החיבור בין טלפוניה נייחת/סלולרית וטכנולוגיית האינטרנט (מה יותר פשוט מאשר לגלוש במהלך נסיעה באמצעות הפעלה קולית לאתר אינטרנט ולבדוק בו מה תחזית מזג האוויר באיזורך, או לקבל מידע עדכני על מצב התנועה?), העובדה ששימוש בקול טבעי ופשוט יותר מאשר הקשה על מקשי טלפון (ניתן לדלג בקלות רבה על שורות ארוכות של הקשות טורדניות ולהגיע ישר לעיקר), יכולות חיוג קולי מספר טלפונים אישי (במיוחד עבור בעלי טלפונים סלולריים בעת נסיעה), העובדה שנקבעו סטנדרטים (הגופים הגדולים מיישרים קו), תחיקה (האוסרת על החזקת טלפונים בזמן נסיעה) והסיבה החשובה ביותר להערכות האופטימיות: הטכנולוגיה הגיעה לבשלות וניתן להציג מודל לגבי החזר על ההשקעה בה.

כיום, די לדפדף בעיתונות כדי לגלות מספר גדל והולך של סיפורי הצלחה עסקיים המפרטים יישומי ASR ב'עולם האמיתי'. שירותי ASR, כך נראה, מוצעים ברחבי העולם על ידי מגוון רחב של ספקי שירותים ומפעילי טלפוניה, כולל שמות דוגמת AT&T, Be-Vocal (פורטל קולי), Bell Atlantic (חיוג מופעל קול – VAD), BellSouth (שירותי מידע מופעלי קול), Orange UK (שירותי 'עוזר אישי'), Sprint PCS (VAD), Tell-Me (פורטל קולי), TeleCorp PCS (דואר מונחה קול), United Airlines (מעקב אחר מטען אבוד והזמנת טיסות) וסלקום הישראלית, אשר סיימה בימים אלה בהצלחה מרובה תוכנית נסיונית רבת היקף במסגרתה הופעל בחברה לטובת 4200 העובדים ספר טלפונים קולי ארגוני המבוסס על טכנולוגית ASR כחול לבן של NSC. השירותים הללו ואחרים מתאפשרים תודות למנועי זיהוי דיבור מחברות דוגמת Nuance, Scansoft, IBM, NSC ואחרות.

על המסלול

כיום, רוב יישומי ה'שטח' של טכנולוגיית ה- ASR הם יישומים מבוססי מנועי זיהוי דיבור בתוכנה. בשלבי החיים הראשונים של השימוש בטכנולוגיית ה- ASR, כאשר דובר על שלבים נסיוניים/פרוייקטליים ראשוניים, גילו הנסיינים רגישות מעטה לעלותו של ערוץ זיהוי דיבור כמו גם למספר ערוצי זיהוי הדיבור בקופסא אחת (ערוץ זיהוי דיבור מוקצה לשיחה נכנסת במקביל להקצאת ערוץ טלפוניה). המצב השתנה כאשר העסק עבר ליישומי ה'עולם האמיתי', בהם ישנו צורך במספר גדול של ערוצי זיהוי דיבור. בשירותים כאלה, נדרשת המערכת להתמודד עם מספר גדול של מנויים אבל גם מחייבת שמקורות ASR יהיו זמינים לכל אורכה של ההתקשרות, נתון המחייב מערכות בנות אלפי או עשרות אלפי ערוצי ASR. המחיר לערוץ עבור מפעיל הטלקום הוא רכיב משמעותי בבחינתו את החזר ההשקעה (ROI) של השירות ובכך על החלטתו האם לרכוש. פתרון חומרה מבוסס מעבדים יעודיים (DSP) אמור להיות זול יותר ומתאים יותר לסוג כזה של שירותים הדורשים מספר גדול של ערוצי זיהוי דיבור.

שיקול נוסף ומרכזי הינו מורכבות הפתרון והארכיקטורה של המערכת. מוצר מבוסס מנוע זיהוי דיבור בתוכנה יתמוך עד מספר עשרות ערוצים ב- PC. בדוגמה של החיוג מונחה הקול, יהיה צורך בעשרות מחשבים (!), בעוד שפתרון מבוסס חומרה טיפוסי יכול לתמוך בעשרות ערוצים על כרטיס אחד ועל ידי כך במאות רבות של ערוצים במחשב אחד. כלומר, ניתן יהיה לקבל את כל ערוצי זיהוי הדיבור הנדרשים בשני מחשבים בלבד. המערכת הסופית במקרה של פתרון זיהוי דיבור מבוסס חומרה הינה פשוטה יותר, צורכת שטח פיסי קטן יותר וצריכת הספק נמוכה יותר, כאשר לשניים האחרונים גם היבט כספי.

נראה שזיהוי הדיבור נמצא על המסלול הנכון בדרך להפוך לסיפור הצלחה, הן בשירותים האישיים למנויי הסלולר והן כשירותי מרכז מענה טלפוני המיועד לציבור כולו. כעת, כשיותר ויותר שירותים מבוססי זיהוי דיבור הופכים לנחלת הכלל, נושאים דוגמת עלות לערוץ, מיזעור, 'חוסן' קולי וממשק טבעי של אדם ומכונה הופכים לסוגיות קריטיות במיוחד. ספקי השירות ובעלי התשתיות חייבים להבטיח כי פתרון ה- ASR שבכוונתם ליישם אכן יעמד במשימות המוטלות עליו בכבוד.

ידען רובוטיקה ומיחשוב-על

https://www.hayadan.org.il/BuildaGate4/general2/data_card.php?Cat=~~~855586805~~~65&SiteName=hayadan

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.