סיקור מקיף

מדענים הצליחו לכווץ קובץ מוסיקה לאלפית מגודלו כ-MP3

קובץ המוזיקה מכיל נגינת סולו של קלרינט במשך 20 שניות ומקודד בפחות מקילובייט אחד. ההמצאה התאפשרה בזכות שני חידושים חשובים : יצירת סימולציה המדמה קלרינט אמיתי במחשב וסימולציה של נגן הקלירנט עצמו

קלרינט גרמני. מתוך ויקיפדיה
קלרינט גרמני. מתוך ויקיפדיה

חוקרים באוניברסיטת רוצ'סטר הצליחו ליצור מוזיקה דיגיטלית בקובץ קטן פי אלף מקובץ MP3 רגיל. קובץ המוזיקה מכיל נגינת סולו של קלרינט במשך 20 שניות ומקודד בפחות מקילובייט אחד. ההמצאה התאפשרה בזכות שני חידושים חשובים : יצירת סימולציה המדמה קלרינט אמיתי במחשב וסימולציה של נגן הקלירנט עצמו.

החוקרים הכריזו על ההישג החדש בכנס הבינלאומי של עיבוד אותות ואקוסטיקה שנערך בלאס-וגאס. אין מדובר עדיין בשיחזור מלא של ביצוע הקלרינט המקורי, אך החוקרים אומרים כי הם מתקרבים לכך.

“זו למעשה הדרך בה בני-אדם יוצרים מוזיקה,” אומר מרק בוקו, פרופסור להנדסת חשמל ומחשבים ושותף ליצירת הטכנולוגיה החדשה. “לא אמור להיות צורך למדוד את המוסיקה אלפי פעמים בשניה, כפי שאנו עושים בסי-די. אנשים לא יכולים לתפעל את הלשון, האצבעות והנשיפות שלהם כל-כך מהר.”

כאשר המחשב מנגן את המוסיקה לפי הקובץ החדש, הוא משחזר הלכה למעשה את הביצוע המקורי, בהתבסס על כל מה שהוא יודע אודות קלרינטים ונגינה בקלרינטים. שני דוקטורנטים של בוקו, שייאו-שייאו דונג ומארק סטרלינג, מדדו ואמדו את הדרכים השונות בהן משתנה צליל הקלרינט – החל בלחץ המופעל על קנה כלי-הנגינה בנגינת התווים השונים וכלה בדרך בה הצליל מתפשט מהכלי. לאחר מכן הם יצרו מודל ממוחשב של הקלירנט. התוצאה היא כלי נגינה וירטואלי המבוסס לגמרי על מדידות אקוסטיות מהעולם הממשי.

לאחר שהחוקרים יצרו את הקלירנט הוירטואלי, הם המשיכו ויצרו את הנגן הוירטואלי. הם דימו את הדרך בה נגן הקלרינט מתפעל את כלי הנגינה, כולל מנח האצבעות, עצמת הנשיפה והלחץ שמפעילות השפתיים על מנת לקבוע כיצד הקלרינט הוירטואלי יגיב לכל אלה. עכשיו, אומר בוקו, המחשב פשוט צריך 'להקשיב' לביצוע קלרינט אמיתי כדי לפענח ולתעד את הפעולות השונות הדרושות ליצירת צליל מסויים. על מנת לשחזר את הצליל המקורי, המחשב מזין את רשימת הפעולות שתיעד למודל הממוחשב של נגן הקלרינט. התוצאה היא שיחזור קרוב מאד, גם אם לא מושלם עדיין, של הצליל המקורי.

“אנחנו עדיין מנסים לשלב את דרך הפעולה של הלשון, כדי להבין, למשל, כיצד הנגן מכה בלשונו בפיה של הקלרינט על-מנת לנגן תווים בסטקאטו [בנפרד זה מזה, ר.צ.],” אומר בוקו, “אך במוסיקה עם תווים ארוכים יותר המתמזגים אחד לתוך השני, השיטה עובדת היטב וקשה להבדיל בין הצליל הממוחשב לבין המקור.”

השיטה הנוכחית מסוגלת לטפל רק בכלי-נגינה אחד, אך חוקרים אחרים במעבדה לחקר המוזיקה של אוניברסיטת רוצ'סטר, הצליחו למצוא שיטה המסוגלת להבדיל בין הצלילים של מספר כלים המושמעים ביחד. שילוב של שתי השיטות עשוי להביא לדרך חדשה בה נוכל להקליט ולהשמיע מוזיקה, בכמות מינימלית של מידע שמור.

החוקרים מאמינים כי כאשר השיטה תשוכלל היא עשויה להעניק לטכנאי מחשבים דרכים אינטואיטיביות יותר ליצירת מוזיקה, על-ידי הכלת הפעולות של נגנים וירטואליים בסינתיסייזרים ממוחשבים. בוקו טוען שניתן בעקרון להכליל את השיטה גם עבור קולות אנושיים. המודלים שידמו את מיתרי הקול האנושיים ואת דרכי הנשימה אמנם מסובכים ביותר, אך במידה והוא צודק אנו עשויים לשמוע בעוד מספר שנים ברדיו זמרים חדשים, שיהיו ממוחשבים לחלוטין. כל פריק מחשבים יוכל להתגאות במיתרי הקול העשירים של פבארוטי, עם התכנה הנכונה שיוריד (ברשיון מלא, כמובן) מהרשת. היצירות האופרטיות הסבוכות ביותר יועברו אל תוך המחשב ויקבלו נופכים חדשים. וכל זאת, כמובן, בכמות מינימלית של זכרון שמור על המחשב. כפי שאומר בוקו, “אני חושב שמצאנו את השיטה הדורשת את כמות המידע הזעומה ביותר האפשרית לניגון קטע מוזיקה.”

ולנו לא נותר אלא לתהות – האם אכן יבוא היום בו נשמע את בבה-לובה ואום-כול-תום מזמרות זו לזו את הדואט מ- 'פנטום האופרה'? והאם באמת כדאי לצפות ליום שכזה?

את התשובות, כרגיל, נמצא רק בעתיד.

מקור (עם דגימות השמע של קטע המוזיקה המקורי וההקלטה שלו בשיטה החדשה) :

12 תגובות

  1. הגירסה הממוחשבת נשמעת יותר טוב מהגירסה המקורית(!)
    (היא יותר “מדוייקת”).

  2. ח. הראשון:
    מה שאמרתי נכון וגם מדוייק.
    אני חוזר ואומר – לא ניתן לדחוס אוסף אקראי של ביטים (אם כל צירוף ביטים הוא שווה הסתברות) בכלל. חד וחלק.
    אפשר להוכיח זאת מתמטית.

  3. ועוד משהו.. אין קשר לכיווץ..
    מיכאל אמר "לא ניתן כלל לדחוס אוסף ביטים אקראי לחלוטין אפילו באופן תיאורטי" וזה נכון אבל לא מדוייק.. ניתן לדחוס עד גבול מסויים (שיכול להיות מאוד קרוב לגודל המקורי)אבל שם זה נגמר. ZIP הוא דוגמא טובה לכך.

    פה אין כיווץ אלא שמירת מידע בפורמט מסויים על {תווים, עוצמת הנשיפה וזמן הנשיפה}.
    ומתוך ידע מוקדם (!!!!!!!!!) שמדובר בקלרינט ובנתונים אלו, מתרגמת התוכנה את הנתונים לצלילים.

    אם היו מכניסים גם גיטרה, כבר הקובץ היה צריך פורמט יותר "שמן" כיוון שהתוכנה לא יכולה לדעת, לדוגמא, אם התו בקובץ אמור להיות תו של גיטרה או של קלרינט. אולי גם לגיטרה יש מאפיינים שאין לקלרינט ולהפך..

    בקיצור, המציאו פורמט אמין ויציב לקובץ קלרינט!
    לא דחסו כלום. זה סוכר. לפנים שלכם. 😉

  4. רעיון מצויין והיה צריך לעשות את זה בשנות ה 90 – זה לא כ"כ מסובך (בהנתן מספר מומחים למוסיקה וכמה מתכנתים).
    אפשר לבנות גם מודלים מתמטיים שיראו "הטלה" של המוסיקה לצורות תלת-מימדיות ב real time (ע"י שימוש ב matlab או כלי דומה), דר שיעצים את ההבנה וההנאה ממוסיקה.

    ויאללה לעבודה, יש עוד כלי מוסיקה לסמלץ, וכשתהיה "חבילת כלים מוסיקלית" למכירה, מוסיקאים יוכלו סוף סוף לעשות מה שהם באמת רוצים ללא צורך בלהקה והוצאות כספיות עצומות מיותרות 🙂

  5. 6:
    הזלזול שלך אינו במקומו.
    כל שיטות הדחיסה נועדו לדחוס חומר שאינו אקראי כי לא ניתן כלל לדחוס אוסף ביטים אקראי לחלוטין אפילו באופן תיאורטי.
    לכן תוכנות שדוחסות תמונה מניחות המחות מסויימות על העולם ותכומות שדוחסות טקסט מניחות הנחות אחרות.
    נראה לי שכלים לדחיסת דיבור ומוסיקה הרבה יותר מעניינים את רוב בני האדם מכלים לדחיסת נפיחות וסביר להניח שהמילון שיתפתח יכיל מספר מאד מצומצם של דברים מעניינים ומושג כללי של "כל השאר" שיועבר ללא דחיסה או עם דחיסה פרימיטיבית יותר.

  6. וכמובן את המעי הנושף אוויר דרכו
    כך יהיה ניתן להקליט נפיחה של 20 שניות בפחות מקילובייט אחד !

    אח”כ יש לסמלץ מנוע של רכב, משק כנפיו של אלבטרוס לבן החזה ועוד מאות מליוני מקורות צליל. אכן שיטה חסכונית ביותר. רק שכחו להזכיר כי גודל ה”מילון” יהיה בקירוב כמה עשרות ג’יגות טובות

  7. ההבדל בין זה למידי הוא בדרך ההקלטה, הקושי הוא לזהות את הצלילים המנוגנים.

  8. זה לא באמת שונה מהעקרון של MIDI
    במקום לתת למחשב לנגן מוזיקה מוקלטת אתה נותן לו את התווים כדי שהוא "ינגן" באמצעות סימולציה של כלי (כשMIDI מסמלץ אורגן)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.