סיקור מקיף

אלגוריתם אקוסטי מסוגל לבודד שיחה בין שני אנשים באולם הומה אדם

בהמשך ניתן יהיה להטמיע את האלגוריתם במכשור ללקויי שמיעה ולאפשר להם למקד את שמיעתם בנקודה עליה הם מסתכלים ■ גם סוחרי הסמים כבר לא יכולים לסגור עסקאות בהמולת בתי הקפה ■ אוזניים (חכמות) לכותל

ד'ר שרון גנות
ד'ר שרון גנות

אחת הדרכים שבהם נוקטים מתכנני פיגועים או אנשי הפשע המאורגן למיניהם לתקשר זה עם זה בלא חשש מהאזנות של המשטרה, היא ביצוע השיחות הללו בחדרים הומים מאנשים, כך שגם אם מיקרופון קולט אותם יהיה קשה מאוד לפענח את הדברים, בעיקר בשל רעש הרקע העצום של השיחות האחרות המתבצעות סביבם במקביל.

ביריד המדע שהתקיים לאחרונה באוניברסיטת בר-אילן, הציג ד”ר שרון גנות מביה”ס להנדסה מערכת למיצוי של דוברים מתוך בליל של שיחות.

“האלגוריתם החדש משתמש במספר מיקרופונים המפוזרים במרחב”, מסביר ד”ר גנות. “תחילה אנו מאתרים את הדוברים הרצויים באמצעות סריקת המרחב. המידע המגיע למערך המיקרופונים מסונן באמצעות מסנן מרחבי שפיתחנו שמצליח למחוק את הדוברים הלא רצויים ולהשאיר את הדוברים הרצויים כמעט ללא עיוות. בכך הצלחנו, למעשה, להתמודד עם תופעה, הידועה כ”בעיית מסיבת הקוקטייל”, שבה אנשים רבים מדברים אך אנו רוצים לשמוע שיחה של זוג אחד מתוך כולם” אומר גנות. לדבריו, האלגוריתם גמיש ולאחר הפעלתו הראשונית ניתן למפות ולהאזין לדוברים אחרים בחלל החדר.

“בשלב הבא ניתן יהיה להטמיע את האלגוריתם בתוך עזרי שמיעה ובכך לסייע ללקויי שמיעה כשהם נמצאים בסביבה רועשת” מתאר ד”ר גנות. “ניתן יהיה למשל לאפשר להם להקשיב לשיחה המתקיימת בכיוון שאליו הם מסתכלים. כמובן, כאשר המשטרה רוצה לצותת לחשודים כגון סוחרי סמים המרבים להיפגש במקומות הומי אדם, ניתן יהיה להאזין להם, אם יעלה ביד אנשיה לשתול מספר מיקרופונים” מוסיף ד”ר גנות.. לדבריו, כעת פועלים בבר-אילן על שכלול האלגוריתם בסיוע מחקר ממומן, ובין היתר המטרה היא לעקוב גם אחרי דוברים הזזים בחדר ואינם עומדים במקום אחד. במסגרת זו מוקמת בביה”ס להנדסה מעבדה אקוסטית ייחודית בישראל, שתאפשר ביצוע ניסויים בתנאי אמת.

פיתוח זה הינו חלק מעבודת המאסטר של שמוליק מרקוביץ בהנחיית דר' שרון גנות ופרופ' ישראל כהן מהטכניון.

11 תגובות

  1. להתבסס רק על הפרשי זמן לא יעבוד בתדרים גבוהים בגלל תופעת ה ambiguity לכן יהיה צורך לנצל עוד פרמטרים חוץ מה ITD

  2. אני חושב שהבעיה שהם נגשו אליה במאמר היא העובדה שיש יותר שיחות ממקרופונים ולכן לא מתחייב פיתרון יחיד מהICA.

    הדרך הנוספת היא להשתמש במודל אקוסטי של הסביבה כדי להוסיף מידע ל ICA ולחשב מה וקטור המשקולות של כל המקרופונים, מכונה: forwared model

    קצת לא ברור לי מה החידוש כאן, המודל האקוסטי? משתמשים בשיטות כאילו במדעי המוח זה זמן רב: מנסים "להאזין" לקבוצות נוירונים מתוך כל המוח באמצעות "מקרופונים מסוג:" EEG או MEG

  3. א. האם אין כאן עבירה על החוק האוסר האזנת סתר לשיחה שהמצוטט אינו שותף לה, אלא בצו בימ"ש ?
    ב. עולות בדעתי שתי שיטות של איתור אפשריות. האחת איתור האפנון של הדיבור המסויים אותו מחפשים. זה מחייב כמובן דגימה מוקדמת של האדם המצוטט. השניה איתור מדוייק במרחב של האדם המצוטט,למשל ע"י קרן לייזר ואז, כיוון מערכת המיקרופונים להאזנה ממוקדת מאותה נקודה. זה עשוי לפגוע בחשאיות הציטוט.

  4. יובל:
    זה בהחלט רלבנטי (
    http://en.wikipedia.org/wiki/Independent_Component_Analysis
    ) אבל סביר שהפתרון שיושם מתייחס איכשהו גם להפרשי הזמן (לפחות במובן של נקיטת צעדים לניטרולם) כי אחרת לא היה צורך בהתאמת המערכת למצב של תנועת מקור הקול.
    חוץ מזה הם מדברים בפירוש על מסנן מרחבי.

  5. אני דווקא אהבתי את העובדה שהמכשיר פותח לצרכים מדעיים וכדי לעזור לכבדי שמיעה, אולם הכתבה מדברת על עולם הפשע והמודיעין.

    פניה לשוק הביטחוני מכפיל פי כמה את הסיכוי כי הטכנולוגיה תמומש, עובדה שהתקבל מימון להמשך הפיתוח ואך יבנו מעבדה אקוסטית מהגדולות בארץ.

    לפעמים צריך גם לדעת איך (ולמי) לשווק את המוצר כדי למנף טכנולוגיות מתקדמות.

  6. עמי:
    דווקא לאזרח השקט זה לא יפריע. זה יפריע רק למי שמשמיע קול 🙂

  7. נקודה:
    אגב, סביר ביותר ש DTOA הוא אחד המרכיבים במערכת אבל סביר גם שאינו חזות הכלץ

  8. "בין היתר המטרה היא לעקוב גם אחרי דוברים הזזים בחדר ואינם עומדים במקום אחד"

    זו פיסת אינפורמציה שהיה ניתן לחסוך מעולם הפשע. עכשיו הם יודעים איך להתחמק בקלות יתרה.

    מחקר מעניין מאוד. כל הכבוד ואני מקווה שיגיע בהקדם למצב יישומי הן למשטרה והן לבעלי קשיי שמיעה.

    המצב המפחיד הוא שעכשיו, עם אלגוריתם כזה, המדינה תתחיל לפזר מקרופונים בכל מקום ואלמנט החדירה לפרטיות של האזרח השקט ושומר החוק תעלה עוד מדרגה. זה מפחיד ולא נעים לדעת שמאזינים לך בפוטנציאה. אני מקווה שידעו לעשות שימוש בפיתוח לטובה תמיד.

    בברכת חברים,
    עמי בכר

  9. נקודה:
    אתה מחמיץ את הנקודה:)
    אתה יכול למצוא את המיקום באמצעות הפרשי זמנים רק כאשר אתה מזהה במספר מיקרופונים את אותו צליל אבל אם אתה מסוגל לזהות את "אותו צליל" הרי שכבר פתרת את הבעיה.

  10. זה לא נראה כל כך מסובך. באמצעות הפרשי זמנים שבאמצעות מחשב ניתן למדוד בדיוק רב אפשר למקם במרחב את מקור הקול. אני משער שהשלב הראשון הוא סוג של כיול מערכת.

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.