עליבאבא משרד
צילום: טוויטר

"פריצת דרך נוספת מסין" - עליבאבא משיקה את המודל Qwen3

ענקית הטכנולוגיה הסינית השיקה את מודל השפה החדש שלה שלדבריה מציג ביצועים שעולים על אלו של היריבה הסינית Deepseek; האנליסטים מציינים שהמודל מהווה איום גם למודלים המערביים

רוי שיינמן |

הסיניים ממשיכים להתקדם בתחום הבינה המלאכותית כשכעת זוהי ענקית הטכנולוגיה עליבאבא Alibaba -2.75%   שמודיעה על פריצת דרך - החברה השיקה את מודל השפה החדש שלה, Qwen3, שלדבריה עולה על מודל R1 של Deepseek בחלק מהמדדים, כשהאנליסטים מציינים כי המודל אף מאתגר מודלים של ענקיות הטכנולוגיה המערביות. המודל Qwen3 כוללת שמונה גרסאות שונות, בגדלים ושונים, שמעניקים גמישות למפתחים לבנות אפליקציות מבוססות AI גם למכשירי קצה כמו טלפונים ניידים. אחת מהגרסאות, Qwen3-235B-A22B, מתוכננת במיוחד לצמצום דרמטי של עלויות החישוב.


עוד חידוש ב-Qwen3 הוא המעבר הראשון של עליבאבא למודלים שנקראים "מודלי הסקה היברידיים" - שילוב בין יכולות של מודלי שפה מסורתיים לבין תהליכים דינמיים של חשיבה עמוקה. לדברי החברה, המודל מסוגל לעבור בקלות בין מצב "של חשיבה עמוקה" למשימות מורכבות כמו כתיבת קוד, לבין מצב של "חשיבה פשוטה" עבור תגובות מהירות לשימוש כללי.


Qwen3 הוא מודל בקוד פתוח והוא זמין כבר עכשיו להורדה עבור משתמשים פרטיים דרך פלטפורמות כמו Hugging Face ו-GitHub, וגם דרך ממשק הענן של עליבאבא (Alibaba Cloud). המודל גם משולב בעוזר של החברה, Quark. לדברי עליבאבא, מודלי Qwen הפכו כבר לאחת הסדרות הפתוחות הפופולריות ביותר בעולם, עם מעל ל-300 מיליון הורדות ויותר מ-100 אלף מודלים נגזרים שנבנו על גביהם ב-Hugging Face.


האנליסטים מתרשמים - סין מדביקה את הפער למרות המגבלות

לדברי המומחים, השקת Qwen3 מהווה אתגר משמעותי לא רק לחברות מתחרות בסין, אלא גם למובילות במערב. "Qwen3 הוא פריצת דרך משמעותית - לא רק בזכות הביצועים המרשימים שלו, אלא גם בזכות הפיצ’רים המתקדמים שלו", אמר ווי סאן, אנליסט בכיר בתחום הבינה המלאכותית ב-Counterpoint Research. לדבריו, התכונות הבולטות של המודל הן מצב החשיבה ההיברידי, התמיכה ב-119 שפות וניבים, והעובדה שמדובר בקוד פתוח.


אנליסט נוסף, ריי וונג מוושינגטון, שמתמקד בתחרות בין סין לארה"ב בתחומי הטכנולוגיה והכלכלה, ציין כי ההשקה של Qwen3 מדגימה את יכולות הפיתוח המרשימות של מעבדות המחקר בסין, גם לנוכח הגבלות הייצור שהטילה ארה"ב על סין בכל הנוגע לשבבים מתקדמים.


על רקע ההצלחה של דגם R1 מבית DeepSeek בתחילת השנה, שזעזע את סקטור הטכנולוגיה והצית את מהפכת הקוד הפתוח בסין, שחקניות נוספות כמו באידו Baidu.com, Inc -1.19%   הצטרפו למירוץ, חלקן אף עובדות על מעבר למודלים פתוחים בעצמן. לפי דיווח של רויטרס בפברואר, DeepSeek כבר מאיצה את הפיתוח של המודל הבא, R2.


וונג מציין כי בתוך ההקשר הרחב יותר של מירוץ ה-AI בין ארה"ב לסין, הפער בין מעבדות המחקר מצטמצם. "ייתכן שהפער הצטמצם לכדי מספר חודשים בלבד, ויש שיאמרו אפילו לשבועות בודדים", הוא טוען. "ההשקה של Qwen3 והדגם הבא של DeepSeek צפויים להמשיך את המגמה".

קיראו עוד ב"BizTech"


וונג מתייחס בעיקר למגבלות שהטילה ארה"ב על ייצוא של שבבי AI מתקדמים לסין. מדובר בהגבלות שהוטלו כבר בתקופת ממשל ביידן, שבין היתר אילצו את אנבידיה לעצב שבב חדש ופחות מתקדם שיהיה ייעודי לשוק הסיני, ה-H20. עם זאת, לאחרונה ממשל טראמפ הודיע שגם עליו יוטלו מגבלות, ואנבידיה כבר הזהירה שהיא צופה פגיעה של כ-5.5 מיליארד דולר ברבעון הבא כתוצאה מכך. 


השבב החדש של וואווי

לצד זאת, החברה הסינית וואווי הודיעה לאחרונה על שבב חדש שישאף להתחרות באלה של אנבידיה - וואווי פנתה למספר חברות טכנולוגיה בסין כדי לבחון את ההיתכנות הטכנית של שבב הבינה המלאכותית החדש שלה, Ascend 910D. לפי הדיווחים, החברה צפויה לקבל את הדגימות הראשונות של המעבד כבר בסוף מאי. הפיתוח עדיין נמצא בשלבים מוקדמים ויידרשו סדרת בדיקות כדי להעריך את הביצועים ולהכשיר את השבב לשימוש מסחרי. בוואווי מקווים שהגרסה החדשה של סדרת מעבדי ה-Ascend תהיה עוצמתית יותר מה-H100 של אנבידיה, שבב הדגל שאנבידיה השיקה ב-2022 ומשמש לאימון מערכות בינה מלאכותית. דגמים קודמים בסדרה נשאו את השמות 910B ו-910C.


החברה, שמקורה בשנז'ן, פיתחה כמה מהאלטרנטיבות המבטיחות ביותר לשבבי הבינה המלאכותית של אנבידיה, כחלק בלתי נפרד מהמאמץ של בייג'ינג להקים תעשיית שבבים עצמאית. וואווי, שכבר כמעט שש שנים נמצאת ברשימת הסנקציות האמריקאיות, הוכיחה ב-2023 את יכולתה להתגבר על המגבלות עם השקת סמארטפון הדגל Mate 60. המכשיר, שפעל באמצעות שבב מתוצרת סינית, הצליח להפתיע את הממשל האמריקאי והוצג סמוך לביקורה של שרת המסחר דאז, ג'ינה ריימונדו, בבייג'ינג.

הגב לכתבה

השדות המסומנים ב-* הם שדות חובה
דיפסיק AI סיני. קרדיט: רשתות חברתיותדיפסיק AI סיני. קרדיט: רשתות חברתיות

דיפסיק חוזרת - מאתגרת את OpenAI ואת גוגל עם גרסאות חדשות; האם האיום אמיתי?

החברה מציגה מודלים חדשים עם יכולות חשיבה, פתרון בעיות וביצוע משימות, כולל הישגים גבוהים בתחרויות בינלאומיות - האם היא מהווה איום אמיתי לגוגל ו OpenAI?

ליאור דנקנר |

חברת הבינה המלאכותית הסינית דיפסיק (DeepSeek)  חשפה השבוע שתי גרסאות חדשות של מודלים מתקדמים, שמיועדות לחזק את מעמדה מול שחקניות הענק מארה"ב - ובראשן OpenAI וגוגל. מדובר בגרסאות חדשות למודל DeepSeek-V3.2, שמהוות המשך לפלטפורמה הניסיונית שהושקה בספטמבר האחרון.

החברה טוענת כי המודל החדש מציג ביצועים שמשתווים לאלו של GPT-5 של OpenAI במדדים שונים של חשיבה והסקה לוגית. לפי הודעתה, המודל מסוגל לא רק להתמודד עם משימות שדורשות הבנה מעמיקה, אלא גם לעשות שימוש בכלים חיצוניים כמו מנועי חיפוש, מחשבונים ומבצעי קוד - במצב של חשיבה אקטיבית או פאסיבית. דיפסיק לצד חברות סיניות נוספות לרבות עליבאבא ובאידו מצליחות בהדרגה לצמצם את הפער מול הגופים האמריקאיים. הן פועלות מכיוון אחר - בעוד ענקיות ה-AI האמריקאיות משתמשות בכוח עיבודי ענק כדי להשיג את כל המידע שקיים ואת לנתח ולהסיק ממנו, דיפסיק וחלק גדול מהצ'אטים הסינים הנוספים עובדים במודל אחר שלפיו הצ'אט מנתח את התוכן והמידע במקומות מרכזיים מובילים ולא בכל הרשת. הטענה היא שאם מחפשים מידע על מושג מסוים או אירוע מסוים הוא יכול להופיע רבות, מאות אלפים ומיליוני פעמים ברשת ואין טען לנתח את כל המכלול הזה, כי זה ברובו מידע חוזר. לכן, עדיף להסתמך על פחות מקורות אך שיהיו מקורות מיהמנים.


דיפסיק מקבל במבחנים תוצאות טובות וזה בהחלט צריך להדאיג את OpenAI, גוגל ואחרות.  התחרות מתעצמת והסינים מצמצמים את הפער וזה למרות שאין להם את השבבים המתקדמים של אנבידיה בגלל הגבלות הסחר של ממשל טראמפ. 


 

מחשבה ככלי עבודה: אינטגרציה בין בינה לבין פעולה

החידוש המרכזי במודל DeepSeek-V3.2, לפי החברה, הוא שילוב ישיר של יכולת חשיבה עם ביצוע פעולות - דוגמת הפעלת חישובים, הפעלת סקריפטים וקבלת החלטות. המודל, לפי דברי החברה, מסוגל גם לבצע פעולה לאחר תהליך חשיבתי, וגם לפעול מיידית תוך שימוש בכלים מובנים.

במקביל, הושקה גרסה נוספת בשם DeepSeek-V3.2-Speciale, שמכוונת למשימות מורכבות במיוחד בתחומי המתמטיקה והאלגוריתמיקה. מודל זה הראה ביצועים ברמה של מדליית זהב באולימפיאדת המתמטיקה הבינלאומית ובאולימפיאדת המידע (Informatics). החברה טוענת כי הביצועים של Speciale משתווים לאלו של מודל Gemini-3 Pro של גוגל.


ג'ף בזוס אמאזון אמזון
צילום: AFP

אמזון משיקה שבב AI חדש שיתחרה באנבידיה- "השבב שלנו יעיל יותר וחוסך בעלויות"

אחרי שגוגל השיקה שבב מתחרה לאנבידיה - מגיע תורה של אמזון; במקביל משיקה החברה סוכני AI למוקד שירות ותיקון תקלות, אבטחה ולפיתוח תוכנה

מנדי הניג |
נושאים בכתבה אמזון אנבידיה

אחרי שגוגל השיקה שבב חדש לשוק ה-AI, גם אמזון משקיה שבב חדש וטוענת שהוא מהווה תחרות עם חלק מרכזי מהיכולות של השבב של אנבידיה. על פי ההערכות השבב של גוגל מתחרה בסגמנט של 15% בערך מהיקף השוק של השבב של של אנבידיה שלה יש פלטפורמה מלאה. באמזון מדברים על תחרות חזקה עוד יותר. 

באמזון טוענים כי  "השב שלנו יעיל יותר וחוסך בעלויות". השבב החדש הוא תוצר של מחלקת השבבים ב-AWS חטיבת הענן של אמזון והוא נוצר כדי לצמצם תלות במעבדי GPU של אמזון ולהבטיח את יכולתה של החברה בעיבוד והסקה של מערכות AI מורכבות. 

שבב ה-AI של אמזון יקרא Trainium3 ולפי הצהרות החברה, מדובר בשבב שמציע ביצועים טובים יותר בעלות נמוכה יותר, ומאפשר ללקוחות להריץ אימונים ויישומי AI בעלות נמוכה ב-50% לעומת השימוש במעבדים של אנבידיה.

המוצר החדש מצטרף לקו שבבי הבינה המלאכותית של AWS, הכולל גם את Inferentia3 לתהליכי הסקה (Inference) ואת Graviton4 לעומסי עבודה כלליים בענן. מטרת החברה ברורה: להפחית את התלות באנבידיה, לשפר את הרווחיות של תשתיות הענן שלה ולתת מענה למגמה הגוברת של חישובים עתירי משאבים.


מטרה ברורה: לצמצם את הפער מול אנבידיה

השבב Trainium3, שיופעל בשירותי הענן של AWS החל מ־2026, מאפשר אימון מודלים מורכבים יותר בזמן קצר יותר, לטענת אמזון, עד פי ארבעה בהשוואה לדור הקודם של השבב. בנוסף, הוא תומך בתקשורת מהירה יותר בין יחידות עיבוד, דבר קריטי באימון מודלים רחבי היקף.