הידען > אלגוריתם אקוסטי מסוגל לבודד שיחה בין שני אנשים באולם הומה אדם

אלגוריתם אקוסטי מסוגל לבודד שיחה בין שני אנשים באולם הומה אדם

בהמשך ניתן יהיה להטמיע את האלגוריתם במכשור ללקויי שמיעה ולאפשר להם למקד את שמיעתם בנקודה עליה הם מסתכלים ■ גם סוחרי הסמים כבר לא יכולים לסגור עסקאות בהמולת בתי הקפה ■ אוזניים (חכמות) לכותל

אחת הדרכים שבהם נוקטים מתכנני פיגועים או אנשי הפשע המאורגן למיניהם לתקשר זה עם זה בלא חשש מהאזנות של המשטרה, היא ביצוע השיחות הללו בחדרים הומים מאנשים, כך שגם אם מיקרופון קולט אותם יהיה קשה מאוד לפענח את הדברים, בעיקר בשל רעש הרקע העצום של השיחות האחרות המתבצעות סביבם במקביל.

ביריד המדע שהתקיים לאחרונה באוניברסיטת בר-אילן, הציג ד”ר שרון גנות מביה”ס להנדסה מערכת למיצוי של דוברים מתוך בליל של שיחות.

“האלגוריתם החדש משתמש במספר מיקרופונים המפוזרים במרחב”, מסביר ד”ר גנות. “תחילה אנו מאתרים את הדוברים הרצויים באמצעות סריקת המרחב. המידע המגיע למערך המיקרופונים מסונן באמצעות מסנן מרחבי שפיתחנו שמצליח למחוק את הדוברים הלא רצויים ולהשאיר את הדוברים הרצויים כמעט ללא עיוות. בכך הצלחנו, למעשה, להתמודד עם תופעה, הידועה כ”בעיית מסיבת הקוקטייל”, שבה אנשים רבים מדברים אך אנו רוצים לשמוע שיחה של זוג אחד מתוך כולם” אומר גנות. לדבריו, האלגוריתם גמיש ולאחר הפעלתו הראשונית ניתן למפות ולהאזין לדוברים אחרים בחלל החדר.

“בשלב הבא ניתן יהיה להטמיע את האלגוריתם בתוך עזרי שמיעה ובכך לסייע ללקויי שמיעה כשהם נמצאים בסביבה רועשת” מתאר ד”ר גנות. “ניתן יהיה למשל לאפשר להם להקשיב לשיחה המתקיימת בכיוון שאליו הם מסתכלים. כמובן, כאשר המשטרה רוצה לצותת לחשודים כגון סוחרי סמים המרבים להיפגש במקומות הומי אדם, ניתן יהיה להאזין להם, אם יעלה ביד אנשיה לשתול מספר מיקרופונים” מוסיף ד”ר גנות.. לדבריו, כעת פועלים בבר-אילן על שכלול האלגוריתם בסיוע מחקר ממומן, ובין היתר המטרה היא לעקוב גם אחרי דוברים הזזים בחדר ואינם עומדים במקום אחד. במסגרת זו מוקמת בביה”ס להנדסה מעבדה אקוסטית ייחודית בישראל, שתאפשר ביצוע ניסויים בתנאי אמת.

פיתוח זה הינו חלק מעבודת המאסטר של שמוליק מרקוביץ בהנחיית דר' שרון גנות ופרופ' ישראל כהן מהטכניון.

קטגוריות: אוניברסיטת בר אילן, טכנולוגית מיחשוב
תגיות: אוניברסיטת בר-אילן, האזנות, טכנולוגיה, קול

אבי בליזובסקי

עורך אתר הידען ([email protected])

לכל הכתבות של המחבר

11 תגובות

אבי הגיב:

9 בפברואר 2010 בשעה 00:03

להתבסס רק על הפרשי זמן לא יעבוד בתדרים גבוהים בגלל תופעת ה ambiguity לכן יהיה צורך לנצל עוד פרמטרים חוץ מה ITD
ליובל ומיכאל הגיב:

16 ביולי 2008 בשעה 21:40

אני חושב שהבעיה שהם נגשו אליה במאמר היא העובדה שיש יותר שיחות ממקרופונים ולכן לא מתחייב פיתרון יחיד מהICA.

הדרך הנוספת היא להשתמש במודל אקוסטי של הסביבה כדי להוסיף מידע ל ICA ולחשב מה וקטור המשקולות של כל המקרופונים, מכונה: forwared model

קצת לא ברור לי מה החידוש כאן, המודל האקוסטי? משתמשים בשיטות כאילו במדעי המוח זה זמן רב: מנסים "להאזין" לקבוצות נוירונים מתוך כל המוח באמצעות "מקרופונים מסוג:" EEG או MEG
א.בן-נר הגיב:

16 ביולי 2008 בשעה 17:33

א. האם אין כאן עבירה על החוק האוסר האזנת סתר לשיחה שהמצוטט אינו שותף לה, אלא בצו בימ"ש ?
ב. עולות בדעתי שתי שיטות של איתור אפשריות. האחת איתור האפנון של הדיבור המסויים אותו מחפשים. זה מחייב כמובן דגימה מוקדמת של האדם המצוטט. השניה איתור מדוייק במרחב של האדם המצוטט,למשל ע"י קרן לייזר ואז, כיוון מערכת המיקרופונים להאזנה ממוקדת מאותה נקודה. זה עשוי לפגוע בחשאיות הציטוט.
מיכאל הגיב:

16 ביולי 2008 בשעה 08:12

יובל:
זה בהחלט רלבנטי (
http://en.wikipedia.org/wiki/Independent_Component_Analysis
) אבל סביר שהפתרון שיושם מתייחס איכשהו גם להפרשי הזמן (לפחות במובן של נקיטת צעדים לניטרולם) כי אחרת לא היה צורך בהתאמת המערכת למצב של תנועת מקור הקול.
חוץ מזה הם מדברים בפירוש על מסנן מרחבי.
יובל הגיב:

15 ביולי 2008 בשעה 23:17

Independent Component Analysis (ICA)

התאוריה כבר קיימת כ 10 שנים
רמי יושובייב הגיב:

15 ביולי 2008 בשעה 07:12

אני דווקא אהבתי את העובדה שהמכשיר פותח לצרכים מדעיים וכדי לעזור לכבדי שמיעה, אולם הכתבה מדברת על עולם הפשע והמודיעין.

פניה לשוק הביטחוני מכפיל פי כמה את הסיכוי כי הטכנולוגיה תמומש, עובדה שהתקבל מימון להמשך הפיתוח ואך יבנו מעבדה אקוסטית מהגדולות בארץ.

לפעמים צריך גם לדעת איך (ולמי) לשווק את המוצר כדי למנף טכנולוגיות מתקדמות.
מיכאל הגיב:

15 ביולי 2008 בשעה 01:31

עמי:
דווקא לאזרח השקט זה לא יפריע. זה יפריע רק למי שמשמיע קול 🙂
מיכאל הגיב:

15 ביולי 2008 בשעה 01:30

נקודה:
אגב, סביר ביותר ש DTOA הוא אחד המרכיבים במערכת אבל סביר גם שאינו חזות הכלץ
עמי בכר הגיב:

15 ביולי 2008 בשעה 01:27

"בין היתר המטרה היא לעקוב גם אחרי דוברים הזזים בחדר ואינם עומדים במקום אחד"

זו פיסת אינפורמציה שהיה ניתן לחסוך מעולם הפשע. עכשיו הם יודעים איך להתחמק בקלות יתרה.

מחקר מעניין מאוד. כל הכבוד ואני מקווה שיגיע בהקדם למצב יישומי הן למשטרה והן לבעלי קשיי שמיעה.

המצב המפחיד הוא שעכשיו, עם אלגוריתם כזה, המדינה תתחיל לפזר מקרופונים בכל מקום ואלמנט החדירה לפרטיות של האזרח השקט ושומר החוק תעלה עוד מדרגה. זה מפחיד ולא נעים לדעת שמאזינים לך בפוטנציאה. אני מקווה שידעו לעשות שימוש בפיתוח לטובה תמיד.

בברכת חברים,
עמי בכר
מיכאל הגיב:

15 ביולי 2008 בשעה 01:24

נקודה:
אתה מחמיץ את הנקודה:)
אתה יכול למצוא את המיקום באמצעות הפרשי זמנים רק כאשר אתה מזהה במספר מיקרופונים את אותו צליל אבל אם אתה מסוגל לזהות את "אותו צליל" הרי שכבר פתרת את הבעיה.
נקודה הגיב:

15 ביולי 2008 בשעה 00:29

זה לא נראה כל כך מסובך. באמצעות הפרשי זמנים שבאמצעות מחשב ניתן למדוד בדיוק רב אפשר למקם במרחב את מקור הקול. אני משער שהשלב הראשון הוא סוג של כיול מערכת.

כתיבת תגובה

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.

אלגוריתם אקוסטי מסוגל לבודד שיחה בין שני אנשים באולם הומה אדם

אבי בליזובסקי

11 תגובות

כתיבת תגובה

הנקראים ביותר בחודש האחרון

מידע נוסף