גנסן הואנג מנכל אנבידיה
צילום: אנבידיה
דעה

איפה הנסיקה של אינבידיה פוגשת את ישראל? מחשבות על בינה מלאכותית

הקשר בין הזינוק במניית אינבידיה להייטק הישראלי, איפה אינטל בעולם ה-AI, מה ישראל צריכה לעשות כדי ליהנות מצמיחה בתחום? וגם - על מלאנקוס הישראלית שנמכרה לאינבידיה, על המקצועות שיעלמו ועוד.

1. אינבידה היא המובילה בעידן הבינה המלאכותית. המובילות הטכנולוגית שלה היא פער של כמעט שנתיים על מתחריה. AMD מאחור.

מייקל אייזנברג, קרדיט: שלומי יוסף

   מייקל אייזנברג, קרדיט: שלומי יוסף

2. אינטל וישראל. אינטל שיש לה עובדים רבים בישראל והרבה כסף ממשלתי הושקע בה, נשארת מאחור.

3. מלאנוקס. אחת הרכישות הטובות של אינבידיה היא מלאנוקס הישראלית. מלאנוקס עזרה לאינבידיה לפרוץ לעולמות הדטה-סנטר. השמועות אומרות שמלאנקוס היא אחת הרכישות החשובות בתולדות אינבידיה והוא משמעותית לאספקת תשתית ל-LLMs (מודלי שפה ענקיים) לעידן הבינה המלאכותית.

4. תשתיות המחשוב לעידן הבינה המלאכותית הם לא רק יקרות מאד אלא נמצאות במחסור. לכן המחירים עולים. יש לזה שתי השפעות. העלות של הקמת סטארט אפ בתחום עולה (למרות שלאורך זמן זה יירד כשזה יבוזר). בנוסף, הגישה לכח המחשובי לא פשוטה.

5. השקעה בתשתית. מדינת ישראל חייבת להשקיע בתשתית מיחשובית לעידן הבינה המלאכותית. ברשות לחדשנות יש תוכניות טובות אבל לא גדולות מספיק לדעתי. ההחלטה על הקיצוץ בתקציב המדען במאה מיליון שקל בעידן של תחרות על המשאבים האלה היא החלטה גרועה במיוחד. על המדינה להתייחס לבינה מלאכותית כמו תכנית גרעין. זה רמת החשיבות של האירוע. ועלינו לבנות תשתיות לאומיות תוך כדי השקעה גדולה לצורך זה. זה חשוב כלכלית, ביטחונית וערכית. חייבים להיות מובילים בתחום בדיוק כמו בסייבר.

6. מקצועות שיפגעו. יש לא מעט אנשים עם רמת מיומנות בינונית עד נמוכה שעובדים בתחומים שהבינה מלאכותית בעידן הנוכחי כבר מסוגלת לעשות יחסית אוטומטית. המשרות שלהם בסכנה. למשל, מתכנתים ברמה של בתי תוכנה (רמה בסיסית של תכנות) ורואי חשבון מתחילים.  אלו תחומים שאחיותנו החרדיות הוסללו לשם לא מעט ומצטיינות בהם. וזה מצריך חשיבה מחודשת.

7. אנחנו בתקופה מאתגרת ומרתקת. הבינה המלאכותית תיצמח בשיעורים משמעותיים. המניה של אינבידיה לא זינקה 25% סתם. יש לה המון רבעונים של צמיחה לתוך המגמה הזאת. הבינה המלאכותית גם מעלה שאלות ערכיות. חלק מהיותנו מדינה יהודית וערכית מחייבת היערכות ערכית לעידן הזה. לחשוב על סדרי עדיפויות וגבולות. על הזדמנויות וסכנות. על המשגה והישגים. 

קיראו עוד ב"BizTech"

תגובות לכתבה(2):

הגב לכתבה

השדות המסומנים ב-* הם שדות חובה
  • 2.
    אנבידיאן 28/05/2023 08:18
    הגב לתגובה זו
    ניכר מהכתוב שלכתב אין מספיק רקע בתחום. כשאין משהו חכם להגיד, עדיף לתת לאחרים להגיד.
  • 1.
    אבי 27/05/2023 09:57
    הגב לתגובה זו
    רואי חשבון יעשו מה שעורכי דין יעשו - הם יזמו חקיקה שכל חוות דעת או ביקורת או עבודה חייבת להעשות על ידי אדם אנושי. לכן אנחנו לא ניפטר מעו"ד ורו"ח גם עוד 20 שנה
ג'ף בזוס אמאזון אמזון
צילום: AFP

אמזון משיקה שבב AI חדש שיתחרה באנבידיה- "השבב שלנו יעיל יותר וחוסך בעלויות"

אחרי שגוגל השיקה שבב מתחרה לאנבידיה - מגיע תורה של אמזון; במקביל משיקה החברה סוכני AI למוקד שירות ותיקון תקלות, אבטחה ולפיתוח תוכנה

מנדי הניג |
נושאים בכתבה אמזון אנבידיה

אחרי שגוגל השיקה שבב חדש לשוק ה-AI, גם אמזון משקיה שבב חדש וטוענת שהוא מהווה תחרות עם חלק מרכזי מהיכולות של השבב של אנבידיה. על פי ההערכות השבב של גוגל מתחרה בסגמנט של 15% בערך מהיקף השוק של השבב של של אנבידיה שלה יש פלטפורמה מלאה. באמזון מדברים על תחרות חזקה עוד יותר. 

באמזון טוענים כי  "השב שלנו יעיל יותר וחוסך בעלויות". השבב החדש הוא תוצר של מחלקת השבבים ב-AWS חטיבת הענן של אמזון והוא נוצר כדי לצמצם תלות במעבדי GPU של אמזון ולהבטיח את יכולתה של החברה בעיבוד והסקה של מערכות AI מורכבות. 

שבב ה-AI של אמזון יקרא Trainium3 ולפי הצהרות החברה, מדובר בשבב שמציע ביצועים טובים יותר בעלות נמוכה יותר, ומאפשר ללקוחות להריץ אימונים ויישומי AI בעלות נמוכה ב-50% לעומת השימוש במעבדים של אנבידיה.

המוצר החדש מצטרף לקו שבבי הבינה המלאכותית של AWS, הכולל גם את Inferentia3 לתהליכי הסקה (Inference) ואת Graviton4 לעומסי עבודה כלליים בענן. מטרת החברה ברורה: להפחית את התלות באנבידיה, לשפר את הרווחיות של תשתיות הענן שלה ולתת מענה למגמה הגוברת של חישובים עתירי משאבים.


מטרה ברורה: לצמצם את הפער מול אנבידיה

השבב Trainium3, שיופעל בשירותי הענן של AWS החל מ־2026, מאפשר אימון מודלים מורכבים יותר בזמן קצר יותר, לטענת אמזון, עד פי ארבעה בהשוואה לדור הקודם של השבב. בנוסף, הוא תומך בתקשורת מהירה יותר בין יחידות עיבוד, דבר קריטי באימון מודלים רחבי היקף.

דיקטה. קרדיט: רשתות חברתיותדיקטה. קרדיט: רשתות חברתיות

בתמיכת אנבידיה: דיקטה מכניסה את ארון הספרים היהודי ל-AI

העמותה הישראלית השיקה שלושה מודלי קוד פתוח שמאומנים על מאות מיליארדי טוקנים בעברית ובאנגלית, ומציבים סטנדרט חדש ליכולות AI מקומיות; טכנולוגיות האימון שבו השתמשה היא של אנבידיה

רן קידר |

בזמן שמודלי השפה הגדולים ממשיכים להתקדם במהירות ברחבי העולם, רובם עדיין נשענים על אנגלית כשפה מרכזית, ורק בהמשך מקבלים עדכוני התאמה לשפות אחרות. היום מציגה דיקטה חלופה יוצאת דופן: סדרת Dicta-LM 3.0, אוסף מודלים גדולים וריבוניים בקוד פתוח, שתוכננו לספק יכולות עומק בעברית כבר משלב האימון הראשוני, לא כתוספת, אלא כבסיס.

בניגוד למודלי שפה בינלאומיים שנשענים כמעט לחלוטין על גופי מידע באנגלית, המודל של דיקטה מאומן מראש על מאגר דיגיטלי עצום של טקסטים עבריים, הכוללים מקורות פומביים, ארכיונים, אוספי תכנים מהספרייה הלאומית, חומרים שנמסרו לעמותה בידי גופים ציבוריים ופרטיים, ונתונים עבריים ייעודיים שפותחו במיוחד לצורכי המחקר. שילובם עם דאטה איכותי באנגלית יוצר מודלים שמבינים עברית ברמת עומק תרבותית ולשונית, תוך שמירה על יכולות ההסקה והידע הגלובלי של המודלים הבסיסיים שעליהם הותאמו.

ברמה הטכנית, מדובר באחת ההשקות החשובות ביותר בתחום ה-AI המקומי: מודלים במשקל 24 מיליארד (על בסיס Mistral), 12 מיליארד (על בסיס מודל בסיסי של אנבידיה) ו-1.7 מיליארד פרמטרים (שמיועד גם למכשירי קצה אישיים). המודלים הללו הוכשרו על כ-150 מיליארד טוקנים (כ-75% עברית, 25% אנגלית), תוך הרחבת חלון ההקשר המקורי של המודלים לכ-65 אלף טוקנים, כלומר כ-26 אלף מילים בעברית. כל שלושת המודלים זמינים לשימוש חופשי, ניתנים להורדה ישירות מ-HuggingFace, וניתנים להרצה הן בתצורה מלאה והן בגרסאות דחוסות כמו FP8 ו-4bit.

בנוסף, המודל הקטן זמין גם דרך אתר דיקטה. 

שלושה מודלים - שלוש מטרות

כאמור, המודל המוביל של הסדרה החדשה מבוסס על Mistral Small 3.1, והוא מותאם להנמקה מתקדמת ולשיחה ארוכת־טווח. בנוסף אליו, ישנו דגם קל משקל המבוסס על ארכיטקטורת אנבידיה Nemotron Nano V2, המאפשר חלון הקשר ארוך משמעותית וצריכת זיכרון נמוכה.

המודל הקטן יותר, מיועד להרצה על חומרה צרכנית, כולל מחשבים אישיים ואפילו מכשירי קצה. בכל הדגמים ניתן למצוא תמיכה מובנית ב-tool calling, המאפשרת חיבור לכלים חיצוניים, API וסביבות מידע בזמן ריצה. השילוב הזה אמור להיות אטרקטיבי לארגונים ישראליים, עם פתרונות AI ריבוניים שיכולים לרוץ on-prem על תשתיות קיימות, מבלי להסתמך על ענן זר או העברת מידע רגיש לחו״ל.