סיקור מקיף

בעתיד האנשים ידברו אל מנועי החיפוש ואלו יענו

פרופ' אורן עציוני מאוניברסיטת וושינגטון בסיאטל, שחתום בין היתר על האתר מטה-קרולר שמאפשר חיפוש בכמה מנועי חיפוש במקביל, מדבר על תחום החיפוש באינטרנט ועל איך בעתיד המחשבים יעשו את העבודה במקומנו

אבי בליזובסקי,

פרופ' אורן עציוני, מנהל מכון טורינג באוניברסיטת וושינגטון בסיאטל

בתוך כעשר שנים, החיפוש באינטרנט יהפוך מכלי שבו הגולש מספק מילות מפתח ומקבל קישורים לאתרים, לכלי שבו הוא ישאל שאלות חופשיות ויקבל תשובות מדויקות גם לשאלות מורכבות במיוחד. כך חוזה פרופ' אורן עציוני, מנהל מכון טורינג באוניברסיטת וושינגטון בסיאטל, שהרצה בנושא שלשום (א') בפני בוגרים וסטודנטים בבית ספר אפי ארזי למדעי המחשב במרכז הבינתחומי הרצליה.

עציוני (42), יליד ישראל שהיגר עם הוריו בגיל 14 לארה”ב ופתח בה כבר בצעירותו בקריירה אקדמית, היה היזם של כמה סטארט-אפים שהטכנולוגיות שלהם סובבות סביב תחום כריית המידע ובהם Farecast – העוסקת באיתור תעריפי תעופה זולים. הוא שימש כ-CTO של חברת Go2net שנרכשה בשנת 2000 על ידי אינפוספיס, וייסד את נטבוט (שנרכשה בידי חברת אקסייט ב-1997). ב-1995 פיתחו עציוני ותלמידו אריק זילברג את אתר מטה-קרולר, מנוע לחיפוש במספר מנועי חיפוש במקביל, וסטארט-אפ נוסף בשם קלירפורסט, העוסק בתחום כריית טקסטים.

פרופ' עציוני אומר, כי חיפוש נהפך לגוף ידע המשקף את כל האנושות. “הדוגמה לכך היא במוצרים החדשים של גוגל, כמו גוגל טרנדס וגוגל Zeitgeist, שמראים מה אנשים מחפשים. Zeitgeist (מושג בגרמנית שעבר כפי שהוא גם לאנגלית ומשמעו רוח הזמן) הוא כלי שמראה כמה אנשים חיפשו היום את מילות המפתח המבוקשות. ואילו בגוגל טרנדס מנסים לראות את המגמות בחיפושים לאורך זמן. “לדוגמה, אם אתה מחפש בגוגל טרנדס את אולמרט עד 2005, הוא בכלל לא מופיע – אף אחד לא חיפש את אולמרט בגוגל ועכשיו יש המון חיפושים, כאשר מספר החיפושים עלה לאחר זכייתו בבחירות, בעיקר בקרב גולשים מארה”ב. עוד מגמה שניתן להבחין בה היא חיפוש של שאילתות בנושאים רגישים במדינות שבהם הן בגדר טאבו, כמו למשל מספר גדול של חיפושים של מילות מפתח בתחום ההומוסקסואליות ממדינות מוסלמיות”.

המחקר שמבצעת כיום קבוצה של כעשרה חוקרים בראשות עציוני במכון טורינג, מנסה לבנות אלגוריתמים שיתנו תבונה מלאכותית למנוע החיפוש. “המחקר שלנו מתמקד ביכולת לשלוף תשובות מדפים, לעבור מהמצב שבו אתה מקבל שאילתא וקורא את הדף, למצב שבו אנחנו הופכים את האינטרנט מהרבה דפים שצריך לקרוא לתשובה מרוכזת, שמרכיביה יכולים לבוא מדפים רבים שהמחשב 'קורא' ומבין. המחקר שלנו עוסק ביכולת של המחשב 'לקרוא' את הדף בצורה יותר מתוכחמת ולשלוף ממנו את העובדות. זה פרויקט מחקר שאני עובד עליו שלוש שנים עם קבוצה של עשרה אנשים – זה פרויקט מחקר בסיסי שיימשך עוד עשרות שנים”.

“לדוגמה”, אומר עציוני, “ניתן ללמד מחשב לנתח מה אנשים חושבים על מוצר, כמו למשל מחשב נייד מסויים. התוכנה תחפש את הדפים שבו מוזכר המחשב, אבל תמשיך ותסווג אותם לפי סקירות. בדפי הסקירה היא תחליט אם הכותבים אומרים דברים חיוביים או שליליים, תמשיך ותבדוק מה הם אומרים ותחזור לגולש עם סיכום בנוסח: 'מצאתי 2,300 סקירות, מתוכם 80% היו חיוביות. צוינו לטובה המקלדת, הסוללה ושירות הלקוחות. לעומת זאת, יש אנשים שלא מרוצים מהמשקל של המחשב'. זה חוסך שעות של קריאת כל המסמכים הללו בעצמך.”

אילו טכנולוגיות נדרשות לעבור שיפור?
“הטכנולוגיות שעדיין צריכות לעבור שיפור הן הטכנולוגיות בתחום האינטליגנציה המלאכותית; הקלאסיפיקציה (הסיווג) היא דוגמה קלאסית של למידה תחת אובייקט והצבתו בקטגוריה זו או אחרת. קריאה זו טכנולוגיה שדורשת הרבה יכולות, כמו למשל יכולת להסיק מסקנות. הרבה ממה שאתה רוצה להבין מהטקסט לא נאמר בצורה מפורשת. אם, למשל, אתה רואה מאמר שבו כתוב כי האדם הלך למסעדה, אכל את האוכל, מאוד נהנה ועזב. תשאל מחשב היום אם הוא שילם את החשבון, המחשב יגיד 'אני לא יודע – זה לא כתוב'. אדם היה מבין שיש להניח שהוא שילם, כי היה מרוצה ולא רדפו אותו”.

מה בדבר פיתוחים בתחום החומרה?
“כבר הרבה זמן החומרה היא לא מה שעוצר אותנו. כדי לבצע את כריית המידע אנחנו משתמשים בקלאסטר של 40 מחשבים. חוק מור רץ הרבה יותר מהר מאשר האינטלגציה של המחשבים. האינטלגציה של המחשבים היא עדיין בעידן האבן, בעוד שהמחשבים עצמם הם במאה ה-21. הבעיות הכי מעניינות של העתיד הן לא בעיות של חומרה, אלא איך להשתמש בכוח האדיר שאנשי החומרה המוכשרים נתנו לנו בצורה נכונה”.

https://www.hayadan.org.il/BuildaGate4/general2/data_card.php?Cat=~~~497009427~~~64&SiteName=hayadan

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.