
המודל הסיני החדש שמטריד את עמק הסיליקון
GLM-5.2 של Z.ai מציע חלון הקשר של מיליון טוקנים, יכולות קוד חזקות ומחיר נמוך יחסית. אחרי דיפסיק, התעשייה האמריקאית מקבלת עוד תזכורת: סין כבר מתחרה בליבת שוק ה-AI
עמק הסיליקון שוב מסתכל מזרחה. אחרי שדיפסיק הראתה שחברה סינית יכולה לטלטל את שוק הבינה המלאכותית, מגיע מודל חדש בשם GLM-5.2 של Z.ai ומעורר עניין חריג בקרב מפתחים, יזמים ומשקיעים בארה"ב. המודל החדש מיועד בעיקר לקוד ולמשימות סוכנים, ומשרת תהליכים שבהם המודל מקבל משימה רחבה, קורא קבצים, שומר הקשר, מתקן בעיות ומתקדם בין שלבים. זה הכיוון שאליו הולך שוק ה-AI: פחות צ'אטבוט שעונה על שאלות, יותר כלי עבודה שמסוגל לבצע חלקים ממשיים מתהליך הפיתוח.
מיליון טוקנים: ממענה לקוד לניהול פרויקט שלם
הנתון המרכזי בהשקה הוא חלון הקשר של מיליון טוקנים. המשמעות היא שהמודל מסוגל לעבד כמות גדולה מאוד של טקסט, מסמכים או קוד בתוך משימה אחת. בפועל, מיליון טוקנים יכולים לכלול בסיס קוד רחב, מסמכי אפיון, תיעוד טכני, בדיקות, היסטוריית שינויים והוראות פיתוח. עבור מפתחים, זה עשוי להפוך את המודל מכלי שמבין קטע קוד קצר לכלי שמסוגל לעבוד על פרויקט רחב יותר, לזהות תלות בין קבצים, לעקוב אחר דרישות, לשמור על מגבלות ארכיטקטוניות ולהתקדם בין שלבים מבלי לאבד את ההקשר שנבנה בתחילת העבודה.
Z.ai מציגה את היכולת הזאת כיתרון מרכזי במשימות של פיתוח ארוך: מעבר על פרויקט שלם, רפקטורינג של מערכות קיימות, מיגרציה בין ממשקי API, שינוי מבנה תיקיות, התאמת ערכות פיתוח ותיקון בעיות המשתרעות על פני כמה שכבות במערכת. המודל תומך גם בקריאות לכלים חיצוניים, פלט מובנה בפורמטים כמו JSON, שמירת הקשר וממשקי MCP - סטנדרט שמאפשר למודלים להתחבר לכלים, מאגרי מידע ומערכות ארגוניות.
המשמעות היא שהמודל אינו אמור להישאר רק בחלון צ'אט. הוא יכול להשתלב בסביבת פיתוח, לקרוא קבצים, להריץ בדיקות, לקבל תוצאות, לתקן את הקוד ולהמשיך לשלב הבא. זהו בדיוק סוג השימוש שחברות כמו אנתרופיק, OpenAI, גוגל ומיקרוסופט מנסות לקדם: סוכני AI שמבצעים משימות, ולא רק מציעים תשובות.
הבאזז סביב GLM-5.2 התחזק אחרי שגיירמו ראוך, מנכ"ל ורסל, כתב ברשת X כי התרשם מאוד מיכולת הקידוד של המודל וכי הדבר משנה את כללי המשחק. גם מאט ולוסו, שכיהן בעבר בתפקידי ניהול במיקרוסופט, בגוגל ובדיפמיינד, כתב לאחר שהתנסה במודל כי מדובר באחד המודלים הפתוחים הראשונים שהוא יכול לראות בהם כלי שימושי לעבודה יומיומית. בעולם שבו חברות תוכנה מנסות להבין כמה עבודה אפשר להעביר ל-AI, מודל חזק וזול יותר הופך במהירות לסיפור עסקי.
המודל הפתוח והזול שמאתגר את ענקיות ה-AI האמריקאיות
Z.ai, שפעלה בעבר בשם Zhipu AI, היא אחת מחברות ה-AI הסיניות הבולטות. בניגוד ל-Open AI ולאנתרופיק, שמוכרות בעיקר גישה למודלים סגורים דרך ענן, Z.ai מקדמת גישה פתוחה יותר, שמאפשרת למפתחים ולארגונים להריץ, להתאים ולשלב את המודל במערכות שלהם. עבור חברות שחוששות מתלות בספק יחיד או מהעברת קוד רגיש החוצה, זו נקודה משמעותית.
לפי נתוני Z.ai, GLM-5.2 מציג שיפור חד מול GLM-5.1. במבחן Terminal-Bench 2.1 הוא מגיע ל-81 נקודות לעומת 62 בגרסה הקודמת, וב-SWE-bench Pro הוא מגיע ל-62.1 נקודות לעומת 58.4. אלה מבחנים שמנסים למדוד יכולת לפתור משימות פיתוח מורכבות, מעבר להשלמת שורות קוד פשוטות.
החברה גם מנסה להתחרות במחיר. לפי מחירון ה-API הרשמי שלה, השימוש ב-GLM-5.2 עולה 1.4 דולר למיליון טוקני קלט ו-4.4 דולר למיליון טוקני פלט. מדובר בתמחור נמוך ביחס לחלק מהמודלים הסגורים המתקדמים, במיוחד במשימות ארוכות שמצריכות עיבוד רב של קוד ומסמכים.
אחרי דיפסיק: סין חוזרת למרכז המרוץ על הבינה המלאכותית
גם אם ההשוואות סביב השקה חדשה דורשות זהירות, הכיוון ברור: סין מנסה להתחרות לא רק באיכות המודלים, אלא גם בכלכלה של המוצר. זו הבעיה עבור החברות האמריקאיות. OpenAI, אנתרופיק וגוגל משקיעות סכומי עתק במרכזי נתונים, שבבים, חוקרים ותשתיות ענן. המודלים שלהן עדיין נחשבים בחלק מהמשימות למתקדמים ביותר בעולם, אך העלויות הגבוהות יוצרות פתח למתחרים. אם חברה יכולה לקבל ביצועים קרובים מספיק במחיר נמוך יותר, ובמיוחד אם היא יכולה להפעיל את המודל בתשתית שלה, היא עשויה לבחור באלטרנטיבה.
זו הייתה אחת הסיבות לכך שדיפסיק הפכה לשם שמוכר גם מחוץ לסין. היא לא רק הציגה מודל בעל יכולות מתקדמות, אלא גם ערערה על ההנחה שרק חברות אמריקאיות שמוציאות מיליארדי דולרים על מחשוב יכולות לייצר מודלים שימושיים ברמה גבוהה. GLM-5.2 ממשיך את אותו קו, אך פונה בצורה ממוקדת יותר לעולם הפיתוח ולשוק הסוכנים.
התחרות מגיעה בתקופה רגישה מבחינה גיאו־פוליטית. ארה"ב הטילה מגבלות יצוא על שבבים מתקדמים לסין, ובינואר 2025 הוסיפה את Zhipu ורבות מהחברות הבנות שלה לרשימת הישויות המוגבלות של משרד המסחר האמריקאי. החברה עצמה התנגדה להחלטה. במקביל, Zhipu משקיעה במעבר לשימוש בשבבים מקומיים, בהם שבבי Ascend של וואווי, כחלק ממאמץ סיני רחב יותר לצמצם תלות בטכנולוגיה אמריקאית.
GLM-5.2 עדיין צריך להוכיח יציבות בשימוש יומיומי, תמיכה מסחרית רחבה, אבטחת מידע, תאימות לכלי פיתוח ושילוב נוח בארגונים מחוץ לסין. מודל שמרשים במשימת הדגמה אינו בהכרח מודל שקל להטמיע במערכת בנקאית, בחברת סייבר, בחברת ביטוח או במוצר תוכנה שמשרת מיליוני לקוחות. אבל הוא כבר עשה דבר אחד: הוא החזיר את סין למרכז השיחה על עתיד הבינה המלאכותית. אחרי דיפסיק, עמק הסיליקון הבין שהאיום קיים. עם Z.ai, הוא מבין שהאיום משתפר מהר - במיוחד בתחומים שבהם מודלים צריכים לא רק לדבר, אלא גם לעבוד.