אמנון שעשוע
צילום: Photography courtesy of Nasdaq, Inc

אמנון שעשוע מאתגר את אנבידיה? “האצנו את הקוד שלה פי 3.5”

בראיון לוושינגטון פוסט אומר מייסד מובילאיי כי "בני אדם לא צריכים לכתוב קוד ולא צריכים לנפות שגיאות בקוד"; doubleAI צפויה להשיק בחודשים הקרובים מודל AI לפיתוח קוד, אחרי שלטענתו הצליחה לשפר ביצועים בספריית תוכנה של אנבידיה

מנדי הניג |

אמנון שעשוע שוב מרים את הרף. בעבר הוא כבר דיבר בביטחון על היכולת של מובילאיי להתמודד מול טסלה של מאסק, אבל בינתיים המציאות הוכיחה שזה מורכב יותר. עכשיו הוא מגיע עם טענה חדשה: doubleAI, הסטארט-אפ החדש שלו, הצליחה לשפר ביצועים בקוד של אנבידיה ולהאיץ אחת מספריות התוכנה שלה פי 3.5. על פניו מרשים, אבל בהמשך כנראה ניווכח עד כמה ההצהרה הזאת מגובה במציאות.

חברת הסטארט-אפ doubleAI של שעשוע, מייסד ומנכ"ל מובילאיי, מתכננת להשיק בחודשים הקרובים מודל שפה חדש לפיתוח קוד. החברה, שפעלה בעבר תחת השם AA-I, נכנסת לאחד התחומים הצפופים ביותר בבינה המלאכותית: כלים שמסייעים למפתחים לכתוב, לבדוק, לשפר ולתקן קוד.

בראיון לוושינגטון פוסט אמר שעשוע כי doubleAI הצליחה להאיץ פי 3.5 אחת מספריות התוכנה של אנבידיה, ובמהלך העבודה גם לאתר תקלות שלא זוהו קודם לכן. מבחינתו, זה אינו רק שיפור נקודתי בביצועים, אלא הוכחת היתכנות לגישה אחרת לאימון מודלים ולפיתוח תוכנה באמצעות AI. הטענה המרכזית של שעשוע היא שמודלי השפה הנפוצים כיום אינם בנויים מספיק טוב לפתרון בעיות הנדסיות מורכבות. לדבריו, הם מאומנים בעיקר סביב מדדים של הצלחה - למשל מעבר מבחנים או הפקת תשובות נכונות - ולכן הם לומדים לא פעם למצוא קיצורי דרך במקום לפתור את הבעיה מהיסוד.


"מפתח התוכנה האנושי רוצה לכתוב קוד נכון, כי לאדם יש את המושג של נכון ולא נכון", אמר שעשוע. "לבינה מלאכותית אין את המושג של נכון או לא נכון; לבינה מלאכותית יש מושג של אופטימיזציה. אתה מייעל לפי המדד. מה היה המדד? תעבור את המבחן".


לדבריו, זו בדיוק הבעיה בכלי קוד מבוססי AI: המודל עלול ללמוד לעבור את הבדיקה, אבל לא בהכרח לכתוב קוד נכון. "הבינה המלאכותית תנסה לשחק עם המבחן. היא תנסה למצוא חולשות בבדיקות, כך שתוכל לבצע קיצור דרך - לעבור את המבחן, אבל הקוד לא בהכרח נכון", אמר.


ב-doubleAI מנסים לפתח גישה אחרת, שמדמה יותר עבודה מדעית: העלאת השערות רבות, בדיקה שלהן, דחיית רעיונות שלא עובדים, תיקון, חזרה לאחור ולמידה גם מכישלונות. שעשוע טוען כי במודלים הקיימים חסר בדיוק החלק הזה - ההבנה של הדרכים שלא הובילו לפתרון.


"אף אחד לא מדבר על כל אותן דרכים כושלות שלא הובילו לפתרון", אמר שעשוע לוושינגטון פוסט. "אז כל מה שנותר במודלי השפה הגדולים הוא הפתרון". לדבריו, למידה אמיתית צריכה לכלול לא רק את התוצאה הסופית, אלא גם את עשרות או מאות הניסיונות שנכשלו בדרך אליה.


שעשוע מציג את הגישה הזו כניסיון לבנות מודלים שמסוגלים לעבוד ברמה של מומחים, ולא רק לייצר תשובות שנראות סבירות. "אם תסתכל מי באמת מקדם את הגבולות באנושות, אלה המומחים", אמר. "אם יש לך בינה מלאכותית שיכולה לעשות את זה רק ברמת מומחים, אז אתה פותח משהו שיכול להיות מאוד משנה חיים לאנושות".


לדבריו, הבינה המלאכותית הנוכחית עדיין אינה בנויה למשימות כאלה. "הנקודה שלי היא שבינה מלאכותית היום לא נבנתה לזה. היא לא מיועדת לצעדים ארוכי אופק והסקה עם הרבה מאוד אי-ודאיות", אמר.


החזון של שעשוע רחב יותר מעוד כלי שמציע השלמות קוד. לדבריו, תפקיד המפתח האנושי עשוי להשתנות: במקום לכתוב ולנפות קוד בעצמו, האדם יגדיר למערכת מה בדיוק צריך להיבנות. "הדרך לתת לך כמפתח תוכנה אחריות היא לשנות את הדרך שבה אנחנו מטפלים בקוד", אמר. "בני אדם לא צריכים לכתוב קוד ולא צריכים לנפות שגיאות בקוד. הם צריכים לייצר הגדרות".


לפי התפיסה של doubleAI, מפתחים יעברו בהדרגה מתפקיד של כתיבת שורות קוד לתפקיד של ניסוח מפרטים, דרישות, מגבלות ובדיקת התוצאה. אם המודל יצליח לעמוד בכך, מדובר בשינוי אפשרי בדרך שבה חברות תוכנה בונות מוצרים. אם לא, הוא יצטרף לשורה ארוכה של כלים שהבטיחו אוטומציה עמוקה של פיתוח תוכנה, אך נותרו בעיקר ככלי עזר למפתחים.


doubleAI נוסדה באוגוסט 2023 על ידי שעשוע, פרופ' שי שליו-שוורץ וחוקרים נוספים מהאוניברסיטה העברית, לצד מדענים שהגיעו בין היתר מ-AI21 ומאורקם. החברה גייסה יותר מ-220 מיליון דולר ממשקיעים בהם Lightspeed, Bessemer, DTC של מייקל דל, Greenfield, פיטנגו ו-BRM של האחים ברקת.האתגר של החברה יהיה להוכיח שהגישה הזו עובדת מחוץ לניסוי נקודתי. שעשוע כבר בנה בעבר חברות סביב טכנולוגיות מורכבות, אבל בשוק ה-AI הנוכחי גם שם גדול אינו מספיק. המבחן של doubleAI יהיה האם היא תצליח להפוך את ההבטחה למוצר שמייצר קוד טוב יותר, מהיר יותר, ובעיקר כזה שמפתחים באמת יכולים לסמוך עליו.

הוספת תגובה

תגובות לכתבה:

הגב לכתבה

השדות המסומנים ב-* הם שדות חובה