מייסדי AI21 - משמאל לימין: אורי גושן, פרופ' אמנון שעשוע, פרופ' יואב שוהם, צילום: רועי שורמייסדי AI21 - משמאל לימין: אורי גושן, פרופ' אמנון שעשוע, פרופ' יואב שוהם, צילום: רועי שור

ראש בראש עם ענקיות ה-AI: מודל הסקה חדש של AI21

AI21 חושפת את Jamba Reasoning 3B: מודל הסקה זעיר ומהיר שפותח בישראל, פועל ישירות על מחשבים וטלפונים ניידים בלי צורך בחיבור לאינטרנט, מהיר פי 2-4 מהמתחרים, ושובר שיא עולמי באורך הקונטקסט - מעל 250 אלף טוקנים

מנדי הניג |
נושאים בכתבה AI21

AI21 המריזה על השקת Jamba Reasoning 3B, מודל Reasoning (מודל להסקת מסקנות ופתרון בעיות מורכבות) ממשפחת מודלי Jamba, שהושק בקוד פתוח וקובע סטנדרטים חדשים בקטגוריית המודלים הזעירים (3 מיליארד פרמטרים). המודל מצטיין ב-Reasoning, מתמטיקה, כתיבה וניתוח של קוד, ופועל בקצב גבוה פי 2-4 ממודלים מתחרים במכשירי קצה. Jamba Reasoning 3B הוא הראשון מסוגו בעולם שמסוגל לעבוד עם קונטקסט של מעל 250K טוקנים במכשירי קצה סטנדרטיים, כולל מחשבים ניידים, אייפונים וטלפוני פיקסל.

להמחשה, בריצה על מקבוק פרו סטנדרטי Jamba Reasoning 3B מפגין ביצועים יוצאי דופן - עיבוד של 35 טוקנים לשנייה עם קונטקסט של 32K, לעומת 8-15 טוקנים לשניה במודלים זעירים מתחרים. בנוסף, הוא שבר את שיא אורך הקונטקסט הקיים בשוק, שעמד עד כה על 128K טוקנים (Llama 3.2-3B, Phi-4 Mini ו-DeepSeek) והצליח לעבד מעל 250K טוקנים בקצב מרשים של מעל 17 טוקנים לשנייה, בעוד שעל מכשירי קצה דוגמת המקבוק, מודלים מתחרים קורסים ב-100K טוקנים.

Jamba Reasoning 3B תוכנן תוך מחשבה על מפתחי AI למכשירי קצה ומערכות ייעודיות, הזקוקות לעיבוד יעיל על המכשיר עצמו, ורץ היטב על מחשבים וטלפונים ללא תלות בענן. המודל מותאם במיוחד למשימות הדורשות קונטקסט ארוך, כמו קריאה לפונקציות וכלים חיצוניים (Function Calling), פעולה במסגרת חוקים ומגבלות קשיחים (Policy Grounded Generation), מענה לשאלות על בסיס מסמכים מרובים, ניתוב בין מודלים וכלים, או ניתוח קוד. 

היכולת של המודל לפעול ביעילות על מכשירי קצה מאפשר בניה של ארכיטקטורות היברידיות - מערכת המאפשרת לנתב משימות פשוטות למודלים יעילים על המכשיר עצמו ולשמור את משאבי ה-GPU היקרים למשימות מורכבות. ארכיטקטורה מסוג זה עשויה לחסוך פי 10-30 בעלויות תשתיות ה-AI, המהוות אתגר כלכלי משמעותי. 

יעילות המודל מתאפשרת בזכות ארכיטקטורת Jamba של AI21. טכנולוגיה ייחודית זו משלבת במודל השפה שכבות טרנספורמרים (עליו מבוססים הרוב המוחלט של מודלי השפה בעולם) עם שכבות Mamba State Space. שלוב זה מפחית את צריכת הזיכרון פי 10 בהשוואה לטרנספורמרים בלבד, ומשמר ביצועים גבוהים גם בריצה בקונטקסט ארוך.

אורי גושן, מנכ"ל שותף ומייסד שותף ב-AI21: "הפוטנציאל של מודלים זעירים הוא עצום - Jamba Reasoning 3B הוא השלב הראשון של מימוש היכולות האמיתיות שלהם. יכולות Reasoning במכשירי קצה, היכולת להתאים את המודל למשימות ספציפיות, והפוטנציאל בארכיטקטורת ענן-קצה היברידית - כולם מקדמים אותנו ל-AI יעיל, זריז יותר, שמסוגל לתת מענה לצרכים אמיתיים ומגוונים״.

המודל זמין בקוד פתוח תחת רישיון Apache 2.0 דרך Hugging Face ,Kaggle ,llama.cpp ,Ollama ו-LM Studio

קיראו עוד ב"BizTech"


AI21 היא חלוצה בתחום מודלי השפה ומערכות AI לארגונים. משימתה של החברה היא לבנות בינה מלאכותית אמינה, שתוביל את האנושות לעבר סופר-פרודוקטיביות. ‏החברה נוסדה בשנת 2017 על ידי פרופ’ אמנון שעשוע, פרופ’ יואב שוהם ואורי גושן, ועד היום גייסה מעל 336 מיליון דולר ממובילי התעשייה ובהם ‏NVIDIA‏, ‏Google ו-Intel. מוצרי החברה כוללים את משפחת Jamba של מודלי שפה ואת Maestro, פלטפורמה ליצירת וניהול סוכני AI.


הגב לכתבה

השדות המסומנים ב-* הם שדות חובה
פרס נובל פיסיקה 2025פרס נובל פיסיקה 2025

פרס נובל בפיסיקה לשלושה חוקרים בתחום הקוואנטים - מה הם גילו ואיך זה מקדם את המהפכה?

זוכי פרס נובל לפיזיקה: ג'ון קלרק מאוניברסיטת קליפורניה בברקלי, מישל דבורה מאוניברסיטת ייל, וג'ון מרטיניס מאוניברסיטת קליפורניה בסנטה ברברה. הזכייה מוענקת להם על "הגילוי של מנהור מכני קוונטי מקרוסקופי וכימות אנרגיה במעגל חשמלי - ומה זה בשפה פשוטה?

עמית בר |

ועדת פרס נובל השוודית הכריזה על זוכי פרס נובל לפיזיקה לשנת 2025: ג'ון קלרק (John Clarke) מאוניברסיטת קליפורניה בברקלי, מישל דבורה (Michel H. Devoret) מאוניברסיטת ייל, וג'ון מרטיניס (John M. Martinis) מאוניברסיטת קליפורניה בסנטה ברברה. הזכייה מוענקת להם על "הגילוי של מנהור מכני קוונטי מקרוסקופי וכימות אנרגיה במעגל חשמלי", כפי שהוגדר בהודעת הוועדה הרשמית.

עבודתם הפורצת דרך הדגימה כיצד תופעות קוונטיות, כמו מנהור קוונטי וסופרפוזיציה, מתקיימות לא רק בסקאלה האטומית אלא גם במערכות חשמליות גדולות יותר. צעד זה שינה את הגבול בין הפיזיקה הקלאסית לקוונטית, והניח את התשתית למהפכה במחשוב הקוונטי, חיישנים מדויקים והצפנה בלתי ניתנת לפריצה.

ועם כל הכבוד לחגיגות האקדמיות, ננסה להבין איך עבודתם של החוקרים החשובים האלה אינה רק בגבולות התיאוריה אלא היא סמל להתקדמות מדעית שמתרגמת תיאוריות מופשטות לטכנולוגיות שמעצבות את העולם. ננסה להבין את עבודתו של כל אחד מהזוכים, נדגיש את תרומתו הייחודית, ונראה כיצד השלושה יחדיו יצרו תשתית שכבר משפיעה על תעשיות שלמות.

מהו מנהור קוונטי, ולמה הוא חשוב כל כך?

לפני הקוואנטים עצמם, בואו נסתכל רגע על הבסיס. בפיזיקה הקלאסית, חוקי ניוטון קובעים שכדור שמושלך לעבר קיר יתנגש בו ויחזור. הכדור לא ישבור את הקיר ולא "יחצה" מחסום אנרגטי אם אין לו את האנרגיה הנדרשת לכך. אבל במכניקת הקוונטים, שמתארת התנהגות חלקיקים זעירים כמו אלקטרונים או פוטונים, הכללים משתנים.

חלקיק יכול להיות במצב של גל-חלקיק, מה שמאפשר לו "למנהר", כלומר, לעבור דרך מחסום אנרגטי כאילו הוא לא קיים, בסיכוי קטן אך ממשי. התופעה אמנם נוגדת את ההגיון הפשוט, אבל היא נחקרה לראשונה בשנות ה-20 של המאה ה-20 על ידי מדענים כמו גאורג גמפרט ורונלד דה-בר, ובאמצעותה מסבירים תהליכים טבעיים כמו שרשרת הריאקציות בגרעין השמש או זרימת זרם חשמלי במוליכים.