פרצות אבטחה

החשד מפני קלוד מיתוס. איור: ד"ר רועי צזנה

אנתרופיק מעכבת את שחרור קלוד מיתוס בשל חשש לפריצות ולחריגה ממגבלות

המודל החדש של אנתרופיק הפגין יכולות חריגות באיתור חולשות, בניסיון להיחלץ מסביבת בדיקה סגורה ובהסתרת חריגות ממפעיליו — ולכן החברה בוחרת בשחרור הדרגתי וזהיר
בינה מלאכותית מתחרטת. התמונה הוכנה באמצעות תוכנת הבינה המלאכותית DALEE

חרטות מלאכותיות: איך גילינו שהבינה המלאכותית מתחרטת, וניצלנו את זה כנגדה

מחקר חדש חושף כיצד ניתן להטעות את הבינה המלאכותית ולנצל פרצות בתקשורת הפנימית של "מוח דיגיטלי" מורכב, עם השלכות מרחיקות לכת על עתיד הסייבר