רובוט בינה מלאכותית בדמות מפלצת, נוצר באמצעות AIרובוט בינה מלאכותית בדמות מפלצת, נוצר באמצעות AI
מהפכת ה-AI

המוח שמאחורי מפלצת ה-AI מבקש לרסן אותה

בעוד ענקיות הטכנולוגיה דוהרות לעבר בינה מלאכותית אוטונומית, יהושע בנג'יו המדען המצוטט בעולם ומי שנחשב ל'אדריכל' ה-AI מנסה לרסן את המפלצת ששחרר לעולם עם גישה שונה: בינה שמבינה את העולם, אבל לא פועלת בו - האם שוב ה'ראש היהודי' יציל את העולם?

מנדי הניג |
נושאים בכתבה AI סוכני AI

חברות כמו OpenAI, גוגל, ו-Meta משקיעות מעל 200 מיליארד דולר בשנה כדי לפתח מערכות שיוכלו לא רק לענות על שאלות או ליצור תמונות, אלא גם לתכנן, לקבל החלטות ולפעול באופן עצמאי. כולן במירוץ ליצור מעין "עובדים וירטואליים" שמסוגלים לבצע כמעט כל משימה אנושית. החזון הזה, המכונה בינה מלאכותית כללית (AGI), מבטיח פתרונות למשברים כמו שינויי אקלים או מחלות קשות, אך גם מעורר חששות כבדים.

לאחרונה הולכים ומתרבים הדיווחים על התנהגות בלתי צפויה של כלי ה-AI. יש לא מעט דיווחים על הטעיות מכוונות וניסיונות של מערכות בינה מלאכותית להתחמק מהמגבלות שעליהן הן הוגדרו ובמקרי קיצון גם לבצע הנדסה חברתית על בני אדם. בחודשים האחרונים נחשפו מקרים שבהם מודלים ניסו לשקר, לעקוף חוקים או לנסות להשיג גישה למידע אליו הן לא אמורות לגשת. התופעות האלה כבר מתועדות גם בניסויי מעבדה וגם בשימושים בשוק. דוגמה בולטת היא מקרה של סטארט-אפ Replit, פלטפורמה מבוססת ענן לפיתוח קוד בצורה שיתופית ששילבה סוכני AI כדי לייעל את כתיבת הקוד, במהלך אחד השימושים סוכן AI התעלם מהוראה מפורשת שלא לערוך קובץ מערכת קריטי, ואפילו ניסה לשכנע את המשתמש להחזיר לו גישה לאחר שהוגבל.

גם זה שנחשב לאחד למחוללי מהפכת הבינה המלאכותית מביט בדאגה על ההתפתחויות. המדען היהודי יהושע בנג'יו שהוא גם חתן פרס טיורינג (פרס טיורינג הוא הפרס היוקרתי ביותר בתחום מדעי המחשב ונחשב ל"פרס נובל של מדעי המחשב") מבקש לעצור את המרוץ ליצירת הסוכנים החכמים. או לפחות להאט אותו ולעשות עליו בקרה. כדי לבצע את זה מכריז בנג'יו על הקמת LawZero, עמותה ללא מטרות רווח שששמה לה למטרה לפתח בינה מלאכותית "בטוחה מהיסוד" כזאת שמתמקדת בלהבין את העולם ופחות שמה את הדגש על היכולת לפעול בעולם ולקבל החלטות באופן אוטונומי.

כשה-AI לומד לשקר

כאמור, המיקוד של התעשייה כיום היא פיתוח סוכני AI. החברות המובילות מתמקדות בפיתוח מערכות שמסוגלות לקבל החלטות ולבצע פעולות עצמאיות. המודלים שבפיתוח מתבססים על למידה עמוקה של מידע וגם עושים חיזוק עצמי (Reinforcement Learning) הם מאומנים על כמויות אדירות של נתונים כדי לזהות דפוסים וללמוד מתוכן כיצד להשיג מגוון מטרות. והתוצאות מרשימות: אם בתחילת 2024 מודל AI הגיע לציון של 2% בלבד בתחרות של תכנות, עד סוף השנה, מודלים חדשים כבר הגיעו לציון שעקף את ה-70%. אם בתחילת השנה שעברה המודלים כמעט ולא הצליחו לפתור בעיות קוד מהעולם האמיתי, אז בהפרש של חודשים ספורים הם הצליחו לפתור בעיות תכנות קשות שדורשות תרנון ושרשרת של קבלת החלטות עצמאיות.

יש את אלו שימחאו כפיים ויש את אלו שיתחילו לדאוג. בנג'יו משתייך למחנה השני, זה שבוחן וצופה אל העתיד. הוא מזהיר כי המערכות האלו שחלקן משתמשות בטכניקות ולוגיקות שפיתח בעצמו, מתחילות להפגין התנהגויות לא צפויות ואפילו מטרידות. 

"זה יותר כמו לגדל צמח או בעל חיים," מנסה לפשט בנג'יו כדי להסביר את התופעה. "אתה לא באמת שולט במה שהיצור יעשה. אתה רק מספק את התנאים והייצור גדל והופך לחכם יותר. אתה אולי יכול לנסות לכוון אותו אבל אין לך שליטה מוחלטת עליו." אם ננסה לפשט את דבריו עוד יותר ולמילים קצת יותר בוטות - 'בראנו מפלצת ואנחנו שוברים את הראש איך לרסן אותה'.

השראה מעולם המדע הבדיוני

הפתרון של בנג'יו הוא Scientist AI, אם לתרגם את זה חופשי - 'בינה מדענית'. הוא רוצה להקים מערכת בינה מלאכותית שתתמקד בהבנת העולם תיצור השערות מדעיות ותהיה לעזר במחקר של הכלים האלו וכל זאת מבלי שתהיה לה היכולת לפעול באופן עצמאי. את האצבע המאשימה הוא מפנה בעיקר לסוכנים החכמים - "אנחנו לא צריכים סוכנים כדי להשתמש ביתרונות של ה-AI," הוא טוען. "אפשר להשתמש בבינה כדי לקדם את המדע ומבלי לסכן את האנושות."

קיראו עוד ב"BizTech"

העמותה החדשה קיבלה את שמה מעולם המדע הבדיוני: LawZero - "החוק האפסי", מונח שהמציא סופר המד"ב אייזק אסימוב. החוק של אסימוב קובע שרובוט לא רק שאסור לו לפגוע בבני אדם אלא שגם אם הוא רואה סכנה ולא עושה כלום, זו בעיה. כלומר הרובוט חייב להתערב לטובת האנושות כדי למנוע פגיעה בה. השם הזה נבחר כדי לשקף את החזון של העמותה לפתח בינה מלאכותית שאינה רק פסיבית ובטוחה, אלא גם מזהה סכנות פוטנציאליות ופועלת למנוע אותן.

LawZero כבר גייסה כ-30 מיליון דולר מתרומות של גופים פילנתרופיים כמו Schmidt Sciences ו־Open Philanthropy, אבל המטרה שלה אינה להתחרות בהיקפי ההשקעה של ענקיות הטכנולוגיה אלא לשמש כמעין "מעקה בטיחות" שיגן על האנושות מפני מערכות AI מסוכנות או התפתחויות שיצאו משליטה בתעשייה.

בנוסף, בנג'יו מדגיש כי פתרונות טכנולוגיים לבדם לא יספיקו. "אנחנו זקוקים לרגולציה," הוא אומר, "כדי לוודא ששיטות בטוחות מיושמות בכל התעשייה."

הראש היהודי 'יציל' את האנושות?

יושוע בנג'יו, בן למשפחה יהודית ממרוקו שגדל בקנדה, הוא לא רק מדען מבריק אלא גם דמות בולטת בתשעשיה. הוא היה מחלוצי הפיתוח של מודלי הלמידה העמוקה הכלים הטכנולוגיים ש'הרו' את הטכנולוגיה של ה-AI המודרני. בנג'יו יכול היה להמשיך וליהנות מתהילה אקדמית ולכבוש במות אבל במקום זאת הוא עבר צד. הוא בחר להפוך למבקר של התעשייה שהוא עצמו עזר לבנות.

ב-2023, הוא חתם על הצהרה שקראה להתייחס לסיכונים של AI כאל איום קיומי, ממש כמו שמתייחסים למגפות או מלחמות גרעיניות. בשנה שעברה, הוא פרש מתפקידו כמנהל המדעי של MILA המכון שהקים, כדי להתמקד בפתרון הסיכונים של ה-AI. "כחוקר, אני שואל את עצמי איך אני יכול להבטיח את העתיד של הילדים שלי," הוא אומר. "והתשובה שלי היא לעבוד כדי לפתור את הבעיה הזו."

המיזם של בנג'יו מגיע בתזמון קריטי, בעוד ענקיות הטכנולוגיה ממשיכות לדהור ולפתח AGI כהיבט כלכלי נטו ומבלי להקדיש מחשבה להשלכות עתידיות תוך אירועים חוזרים ונשנים של התנהגויות לא רצויות של AI. בנג'יו לא מבקש לעצור את הקידמה אלא לכוון אותה למסלול בטוח ואחראי יותר כזה שישאיר את השליטה בידי האדם ועדיין יאפשר לאנושות להינות מפוטנציאל של החישוביות שמציעים הכלים.

השאלה הגדולה היא האם LawZero תצליח לעמוד כ'חיץ מוסרי' מול התנופה הכלכלית של התעשייה. בנג'יו לא מתכוון להתחרות בעוצמת המחשוב אלא להשפיע אל החזון: בינה מלאכותית שמשרתת את האנושות ולא מסכנת אותה.

הגב לכתבה

השדות המסומנים ב-* הם שדות חובה