תוכנת הבינה המלאכותית שהפכה לשחקנית הגו הטובה ביותר בהיסטוריה

לפני שנה וחצי, הצליחה בינה מלאכותית בשם אלפא-גו לגבור על לי סדול, אחד האלופים האנושיים הגדולים במשחק גו. ולא זאת בלבד, אלא שהיא ניצחה אותו 4:1, בזמן שהוא (ושאר המומחים בתחום) לא חשבו שיש לו סיכוי להפסיד. עכשיו האחות הגדולה שלה, אלפא-גו-זירו, לימדה את עצמה לשחק מאפס – ללא מעורבות אנושית – ותוך שלושה ימים של לימוד כבר ניצחה את התכנה המקורית.

משחק גו. צילום: Fcb981, Wikimedia, edited: Mx. Granger.
משחק גו. צילום: Fcb981, Wikimedia, edited: Mx. Granger.

כדי להבין את גודל ההישג, צריך לדבר קודם על אלפא-גו המקורית. מדובר במנוע בינה מלאכותית שרכש את מיומנות המשחק הבסיסית באמצעות כך שהוזנו לתוכו 30 מיליון צעדים שונים שנאספו מ- 160,000 משחקים. בשלב הזה הבינה המלאכותית כבר הגיעה לרמת משחק מרשימה, אבל עדיין לא כזו שהייתה קרובה להתחרות במומחים. אלא שמדובר בבינה מלאכותית מהסוג החדש: כזו המסוגלת ללמוד מתוך התבוננות במשחקים. לכן נתנו החוקרים לבינה המלאכותית לשחק נגד עצמה, וללמוד וללמוד וללמוד מכל משחק. היא שיחקה מספר עצום של משחקים כנגד עצמה – יותר משחקים מכפי שכל מומחה אנושי שיחק במשך חייו – וכשהגיעה לקרב המכריע מול לי סדול, היא חיסלה את השחקן האנושי האומלל לחלוטין.

בעצם, כמעט לחלוטין.

אלפא-גו שיחקה ברמה על-אנושית. היא חשפה אסטרטגיות ששחקנים אנושיים לא היו מודעים אליהן אפילו. במשחק השני היא ביצעה צעד כל-כך יוצא-דופן, שלי סדול נאלץ לקחת מספר דקות הפסקה רק כדי להירגע ממנו. צעד זה מכונה בעגה של שחקני הגו – "אלוהי": יצירתי, חדשני ומיוחד. והיא ניצחה באותו משחק, וגם הייתה בטוחה בניצחון שלה מאמצע המשחק – למרות שהמומחים הצופים לא היו בטוחים מי מוביל לאורך כל הדרך.

אבל סדול לא היה קוטל קנים בעצמו. הוא נחשב לשחקן הגו יצירתי וייחודי, ובמשחק הרביעי הוא כבש בחזרה ניצחון אחד לעצמו. הוא ביצע צעד משלו שהצופים כינו גם אותו "אלוהי" – צעד כל-כך מוזר ויוצא-דופן שאפילו אלפא-גו לא התכוננה אליו, והוא ניצח במשחק בסופו של דבר. ניצחון אחד, ארבעה הפסדים, ושני יריבים – אדם ומחשב – שכל אחד מהם הפגין יצירתיות וחדשנות.

זמן קצר לאחר מכן המשיכה אלפא-גו והשתדרגה עוד יותר לאלפא-גו-מאסטר שניצחה את כל אלופי הגו האסיאתיים, בזה אחר זה.

כל זה היה לפני שנה וחצי, ועכשיו יש גרסה חדשה של אלפא-גו, שחזקה עוד יותר מקודמתה. עד כמה חזקה? הגרסה החדשה מכונה אלפא-גו-זירו, וכשהיא שיחקה נגד הגרסה שניצחה את לי סדול לפני שנה וחצי בלבד, היא רמסה אותה במאה משחקים מתוך מאה. ולא זאת בלבד, אלא שאלפא-גו-זירו תכנתה את עצמה: היא לא הייתה צריכה בכלל את המתכנתים האנושיים שיזינו לתוכה את מליוני הצעדים הראשונים. היא רק שיחקה מול עצמה כבר מההתחלה, לפי סט החוקים הבסיסי של המשחק, ותוך שלושה ימים בלבד הצליחה להגיע לאותה רמה של אלפא-גו. תוך ארבעים ימים היא עקפה גם את אלפא-גו-מאסטר, והפכה לשחקנית הגו הטובה ביותר בהיסטוריה. וכל זאת, כאמור, בלימוד עצמי בלבד, בלי מעורבות או פיקוח אנושיים.

ההתפתחויות הללו תואמות לחזון הסינגולריות של קורצווייל, לפיו מכונות יוכלו ללמוד בעצמן ולתכנן את הדורות הבאים של עצמן. אנו מתקדמים למימוש חזון זה בקצב הולך וגובר. הבינות המלאכותיות מהסוג החדש ביותר יכולות כבר ללמד את עצמן ללא מעורבות אנושית – לפחות בסביבה תחומה היטב, כבמשחקים. לא מוגזם לנחש שבכל מצב שניתן למדל היטב ולהריץ את הבינה המלאכותית עליו, היא תוכל לספק אפשרויות לאופטימיזציה שיעקפו את כל מה שבני-האדם יכולים לחשוב עליו. כבר היום גוגל משתמשת בבינה מלאכותית כדי לשפר את צריכת האנרגיה של הבניינים שלה, למשל. בינות מלאכותיות דומות יוכלו לפתח שבבים מתקדמים יותר ואמצעי חישוב מורכבים יותר. וברגע שנוכל למדל את הגוף האנושי ברמת רזולוציה גבוהה, למשל, נוכל להשתמש בבינות מלאכותיות מתקדמות כדי לפתח טכניקות וטכנולוגיות לשימור הבריאות האנושית.

אבל איך נשמור על הבינות הלומדות באחריותינו? איך נוכל להבהיר להן שפתרונות מסוימים למשחקים – למשל, הכחדה טוטלית של המין האנושי כדי לצמצם את הסיכוי למלחמה עתידית – אינם מתאימים? אלו שאלות שכמה מגדולי החוקרים בבינה מלאכותית מתמודדים עמן כיום, ומנסים להבין איך להקנות לבינה המלאכותית "ערכי-על" שאותם לא תוכל להפר. מה יהיו אותם ערכי-העל? זו כבר שאלה אחרת – אבל כזו שכולנו צריכים לחשוב עליה.

אז קדימה – לסינגולריות. הולך להיות מרגש.

ראו עוד בנושא באתר הידען:

שיתוף ב print
שיתוף ב email
שיתוף ב whatsapp
שיתוף ב linkedin
שיתוף ב twitter
שיתוף ב facebook

10 תגובות

  1. יריב
    אני מסכים עם כל מה שכתבת. מה שאני אומר שאין בהכרח קשר בין כל זה לבין הדרך בה המוח הביולוגי חושב. זה ששניהם מכילים רכיבים שקוראים להם ניורונים לא אומר כלום.

  2. ניסים,

    השתדלתי להבין את מה שכתבת וענית לך בהתאם, אם לא הבנתי אותך נכון בבקשה תסביר שוב בלי לעשות לי חידונים.

    עם כל הכבוד לאפליקציה שכתבת אני לא חושב שהיא קשורה לעניין, גם אני כתבתי תוכנות נחמדות שלומדות בכל מיני דרכים מעניינות.

    אלפא גו היא הרבה יותר קרובה בעקרונות פעולתה למוח של עכבר מאשר לאפליקציות שלך או שלי, בזה אתה יכול להיות בטוח.

    לגבי התולעת, אמנם אין לנו עוד הבנה מלאה של התולעת הזו, אך למרות זאת יצרנו רשתות נוירונים שגם להן יש ״תודעה עצמית״ וגם הן יודעות לחפש מזון ולהתרחק מסכנות כמו התולעת שלך:

    https://www.youtube.com/watch?v=bIuu8URVF58

    שוב אני מנסה להסביר לך, זה שאנחנו עוד לא מבינים עד הסוף איך הרשת העצבית במוח שלנו לומדת לשחק במשחק מחשב, לא אומר שאנחנו לא יכולים ליצור רשתות נוירונים שלומדות לשחק, כנ״ל לגבי רשתות שיודעות לספור או להתנהג כמו תולעת.

  3. יריב
    המשפט האחרון שלך מדגיש לי כמה אתה לא מבין מה אני מנסה להגיד. אני מבקש שתקרא את התגובה שלי שוב ותתיחס למה שכתבתי.

    יריב – בנו מכונה מדהימה שמשחקת גו ברמה גבוהה. חלק מהמכונה הזו היא רשת ניורונים. הניורונים האלה דומות קצת (ממש קצת) לניורונים במוח שלנו. אבל, לרשת הזו אין שום דבר שאפילו מזכירה תודעה עצמית.
    תחשוב רגע – לתולעת עם כ-300 ניורונים יש תודעה עצמית. התולעת יודעת שהיא רעבה, יודעת לחפש בן זוג ולהתרחק מסכנות מסויימות. לאלפא-גו אין כל יכולת כזו.
    אלפא-גו זה בסה"כ מחשב. שיטת העבודה שלה לא שונה מהותית ממערכות לומדות הרבה יותר פשוטות. מימשתי בעבר תוכנה לטייס אוטומטי שלמד לבד איך לשמור גובב ולבצע פניב מתואמת. בעזרת שיטת לימוד אחרת, התוכנה ידעה לבצע קרב אוויר ואף ניצחה טייסי קרב וותיקים. נכון, זה בסדרי גודל יותר פשוט ממשחק גו, אבל אני לא חושב שיש כזה הבדל מהותי.
    מה שכן – אני בטוח שאלפא-גו הרבה, הרבה יותר קרובה לתוכנה שלי מאשר למוח של עכבר.

  4. ניסים,

    משחק גו הוא משימה פי אלף יותר מסובכת מספירה (כמעט כל ילד בן 5 יודע לספור, אבל אין הרבה ילדים בגיל הזה שיודעים לשחק גו, בטח לא ברמה מקצועית) האם אנחנו יודעים כבר כיצד מוחו של שחקן גו מקצועי מבצע את המהלכים שמובילים אותו לניצחון?

    ברור שלא, אבל הנה, יש לנו כאן דוגמא של רשת נוירונים שלמדה בעצמה כיצד לשחק גו, והגיעה לרמה של אלוף בלי לראות אפילו דוגמא אחת של משחק בין בני אדם! איך אתה מסביר את הפלא הזה ניסים?

    שים לב שאתה כל הזמן מתבלבל בין היכולת של רשת נוירונים לבצע משימה כלשהי, ובין היכולת שלנו להבין כיצד היא עשתה זאת, האחד לא תלוי בשני.

    וספציפית לגבי הספירה, חיפוש מהיר בגוגל מראה שישנן רשתות נוירונים שיודעות לספור.

  5. יריב
    אני מניח שאתה מסכים איתי שספירה פשוטה היא פעולה בסיסית וחיונית במוח האדם. האם אתה חושב שאנחנו יודעים איך המוח סופר?

  6. ניסים,

    אתה יכול לצחוק עד מחר אבל אנחנו יודעים הרבה מאוד על אופן פעולת המוח וכיצד לדמות זאת במחשב, התוצאות כפי שניתן לראות בכתבה מדברות בעד עצמן.

    לך גם אם יראו רשת עצבית שעושה את כל מה שאדם עושה אתה תמשיך לצחוק שאנחנו עדיין לא מבינים שום דבר ושזה לא יקרה בקרוב, אז תמשיך לצחוק והתחום ימשיך להתקדם.

  7. בקרוב, יהיו רובוטים על שני רגליים שירוצו יותר מהר מיוסיין בולט. פשוט מדהים.
    אבל צריך לזכור – פעולת הריצה של הרובוט הרבה יותר דומה לריצת האדם, מאשר ה"חשיבה" של המחשב הזה לחשיבת האדם. ההסבר פשוט – אנחנו לא יודעים איך האדם חושב. אנחנו יודעים מעט על איך עובד ניורון, אבל לא מעבר לכך.

  8. היעד הלא רשמי הבא של חוקרי בינה מלאכותית הוא לפי מה שרץ במסדרונות א"ת בקבוצות מחקר בינה מלאכותית זה רפואה בעזרת בינה מלאכותית. זה כרגע לא נראה בהישג יד מהיר. לדעתי לשמור על המכונות שישמרו את המין האנושי, לא יעבוד. בנינו אותה כדמותינו, ואנחנו לא מכבדים תבונות נמוכות משלנו. אנחנו הורגים אותם, אוכלים אותם, לבטח לא נותנים להם זכויות.
    חשוב לציין שהתוכנה מתאמנת על 1.5 מיליון תרחישים לפני שהיא מנצחת אלוף עולם, ושהיא מקבלת הכוונה אנושית בשלב האימון אחרת היא לא מגיעה לתוצאות טובות. זה יתוקן בהדרגה. מ-2012 מוכנסת רגולריזציה של ההכוונות שהיא מקבלת. חשוב לציין גם שאותה בינה שבסה"כ פרצה דרך ב-2012, נוסתה על לפחות 60
    תחומי התמחות שונים והצטיינה יותר מאדם. לפני זה לא היה לרשתות נוירונים הצלחה מסחררת למרות שהתחום התחיל ב 1969. מה עשה את ההבדל מ 1969: כוח החישוב. כרטיס GPU של חברת NVIDIA, והרגולריזציה של ההכוונות שהאלגוריתם מקבל באימון. והרבה אמונה של הקבוצה הראשונה, שפרצה את הדרך, שאימנה חודשיים את האלגוריתם, מבלי לדעת שהם יראו משהו פורץ דרך. הם חיו בעידן שבו לא הייתה תוכנה לתכנות אלגוריתמי בינה מלאכותית והקבוצה ההיא תכנתה ידנית כמו באסמבלר. עבודת פרך על 1.4 מיליון תמונות. כרטיס GPU תוכנן בשביל גיימרים ולא בשביל בינה מלאכותית. היום אותו אימון אורך 3 שעות ויש כלים של GOOGLE שניתנים חינם.

כתיבת תגובה

האימייל לא יוצג באתר.

דילוג לתוכן