כיצד מסייע פענוח הגנום להשוות קטעי וידאו כדי לאתר סרטים מועתקים

מנוע החיפוש שפיתח ד"ר אלכס ברונשטיין מהפקולטה להנדסה באוניברסיטת תל אביב, מאפשר לקחת קטע מסרט ולחפש עותקים ממנו בין עשרות מיליוני סרטים, באותה המהירות בה מתבצע החיפוש הטקסטואלי בשיטה הדומה לחיפוש במאגר גנטי  יישום זה עשוי להיות לחם חוקם של יצרני סרטים הנלחמים בהעתקות פיראטיות.

ד"ר אלכס ברונשטיין
ד"ר אלכס ברונשטיין

תארו לעצמכם מנוע חיפוש אליו אתם מזינים סרט, ומקבלים בחזרה כתוצאות חיפוש סרטים שבהם הקטע הזה מופיע. זה אחד היישומים שאפשריים בזכות אלגוריתם שפיתח ד"ר אלכס ברונשטיין מהפקולטה להנדסה באוניברסיטת תל אביב. יישום זה יהיה לחם חוקם של יצרני סרטים הנלחמים בהעתקות פיראטיות.

המערכת היא כה מדויקת עד שהיא מסוגלת להבחין בקטעים מהסרט גם אם הם עברו עריכה או עיבוד, לרבות שינוי רזולוציה. אין מדובר רק באיתור עותקים זהים של הסרט, אלא גם במתן מידע למחפש מאיזו שנייה עד איזו שנייה בקליפים שונים מופיעים קטעים מהסרט.

לדברי ד"ר ברונשטיין, היום העתקת סרטונים והעברתם ב"ביטורנט" או בתוכנות אחרות של שיתוף קבצים הם דבר שבשגרה, ואולפני הסרטים לא אוהבים זאת, בלשון המעטה. כך ניתן יהיה לדעת מי השתמש בקטעים מהסרטים שבבעלותנו, ואפילו את מיקומם של הקטעים בתוך הסרטים. לאחר שהידע מגיע לבעלי הזכויות הם יכולים להחליט האם למשל לתבוע את הפיראטים.ד"ר ברונשטיין הוא מומחה לתחום ראיה ולמידה חישובית – וחוקר שיטות גיאומטריות שיש להן גם שימוש בענף המכונה ביואינפורמטיקה המשמש לחקר הגנום האנושי באמצעות אלגוריתמים ממוחשבים. "ניצלנו את האנלוגיות בין סדרות גנטיות לסדרות של סצנות וידאו. פיתחנו מערכת הממצה כל סרט לסדרת תווים ייחודית המייצגת אותו בדומה לסדרה גנטית שהביטים בה מייצגים מקטעי DNA. השיטה בעצם מאפשרת חיפוש קטע וידאו באותה יעילות שבה העוסקים בביואינפורמטיקה משתמשים לאתר רצף של בסיסים גנטיים.

ד"ר ברונשטיין ועמיתיו הצליחו לנצל את השיטה כדי לבנות מנוע חיפוש לווידאו שכאשר הוא מוזן לתוך הקלט, המנוע מוצא בתוך מעט זמן העתקים שלו מבין מאות אלפי קטעי וידאו, ממש מחט בערימת שחת.

כיום נעשה החיפוש של קטעי וידאו (לדוגמה באתר יוטיוב) פשוט באמצעות חיפוש בטקסט המתלווה לסרט, ומסתבר שיש המנצלים זאת לרעה, כאשר הם מצמידים לסרט טקסט מטעה, דבר הגורם לתוצאות חיפוש שגויות.

ואולם החוקרים לא הסתפקו רק באפשרות המורכבת בפני עצמה לזהות קטע בתוך ים של סרטונים כפי שהוא, אלא גם הפעילו טכניקות של למידה ממוחשבת במטרה לזהות את הסרט גם אם ביצעו בו עריכה (כשם שמערכות ביואינפורמטיקה יודעות לזהות גנים שאירעה בהם מוטציה. "צילמנו קטע במצלמה סלולארית ממסך טלוויזיה, ואחר כך העלינו אותו לרשת, ונתנו למערכת לחפש, היא זיהתה הן את העותקים המקוריים באיכות הטובה והן את העותק המאולתר, שלכל הדעות אינם זהים במאת האחוזים, ואפילו לא קרוב לכך."

לדברי ד"ר ברונשטיין, השוואה של מנוע החיפוש שפיתח עם המנועים הדומים הקיימים ביום מראה שהאלגוריתם החדש מאפשר לבצע חיפוש מהיר יותר, כאשר בבסיס הנתונים נשמרת כמות קטנה בהרבה של נתונים לעומת מערכות אחרות המבצעות את אותה פעילות.

אם להיות אופטימיים יותר, ניתן לחשוב על מצב שבו בעל הזכויות מאתר עותקים של סרטיו באתר החלפת קבצים, אך במקום לחסום אותם או למחוק אותם הוא פשוט שותל לתוך העותקים הפיראטיים פרסומות ונהנה מרווחיהם.

שימוש אחר הוא לקישור בין העולם הויזואלי לעולם הטקסטואלי. כאשר אנו צופים למשל בסרט DVD, המערכת תוכל לזהות היכן ובאיזה סרט אנו צופים ולהוריד מהרשת קובץ של תרגום, או לשלב בו פרסומות ממוקדות המותאמות לתוכן הסרט. או להפוך את הסרט לאינטארקטיבי – לחיצה על מוצר המופיע בסרט מובילה למשל לדף המוצר באתר המכירות איביי .

יישום אפשרי נוסף הוא מציאות מועשרת – כך למשל יוכל בעל טלפון חכם לצלם אתר בסביבתו ולשדר אותו למערכת החיפוש שמוצאת את כל המידע הרלוונטי על האתר.

ורעיון מקורי נוסף עליו עובדים ד"ר ברונשטיין ועמיתיו הוא לחבר בין שתי תמונות ביו-רפואיות, למשל תמונת CT ותמונת MRI לכדי תמונה אחת, למרות שהתמונות המקוריות נעשו ברזולוציות שונות ובאמצעים שונים לחלוטין. כיום הצליחו החוקרים לנצח שיטות מתחרות והם רואים פוטנציאל רב באלגוריתם המוצע ליישומים בהדמייה רפואית.

עוד בנושא באתר הידען:

8 Responses

  1. תודה על המידע, אני מקווה שיהיו למחקר שימושים גם מעבר ל"לוחמה" בפראטיות.
    היום כשלכל אחד יש גישה למערכת עריכה מצויינת ניתן להפוך את ה mix\meshup לנגיש ואף חוקי.
    כמו מאגר פתוח עם אותה "טביעת אצבע" שתאפשר לנו ללפרק ולהרכיב מיקסים של קול ותמונה
    ושבעזרת מנגנון של micro-payments תאפשר לבעלי הזכויות לקבל את הנתח שלהם.

  2. פיתוח אדיר !! , מעניין האם יוכלו גם לפתח אלגוריתם שידע להגדיל תמונת סרט או סרטון לגודל מסך שלם כאשר במקור הוא עשירית מזה?

    לדעתי זה אפשרי אם יהיה אלגוריתם שיזהה את מרכיבי הפריים ויגדיל כל חלק בנפרד ובחיבור של כל מרכיבי התמונה תתקבל תמונה זהה ואיכותית בגודל המבוקש אשר העין לא תצליח להבחין בהבדל כלשהוא !

  3. פעם חיפשתי חברת מחשבים לפי הלוגו שלה שמצאתי מודבק על ציוד מחשבים אבל השם לא הופיע וחשבתי לעצמי איזה יופי זה יהיה אם לגוגל למשל יהיה שירות שמאפשר לעשות חיפוש מהסוג הזה. אז הנה זה יכול להיות הפתרון. במקום טקסט אתה מעלה תמונה בתיבת החיפוש בגוגל ( או במקרה הנ"ל קטע מסרט ) וזה מוצא את ההתייחסויות.

  4. ובקשר לרעיון של שילוב תמונת CT ו MRI אז הנה רעיון דומה שעלה לי לפני שנים כשעוד הייתי שריונר וביליתי לילות שלמים בתצפית. בהתחלה במכשיר שעבד על הגברת אור כוכבים ולאחר מכן במכשירים הטרמיים תמיד היה חוסר מסויים בפרטים שאם היה שילוב בן שני צורות הראייה היו משלימים אחד את השני. אז הנה עוד רעיון לביצוע. ( בטח מישהו בצבא כבר יישם את זה )

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.