מחשב על עם B200 של אנבידיה. קרדיט: רשתות חברתיות
מחשב על עם B200 של אנבידיה. קרדיט: רשתות חברתיות

גוגל ואנבידיה משיקות תשתית AI שמחברת מיליון מעבדים לעבוד כמחשב אחד

התשתית החדשה שגוגל ואנבידיה מקימות אמורה לאפשר הפחתה משמעותית בעלויות, להגדיל תפוקה ולאפשר עבודה מאובטחת ושמירה על מידע רגיש של ארגונים גדולים, בכך הן מקדמות את השימוש ב-AI כשהן מתייחסות לעלות הרצת AI מיליוני פעמים ביום על ידי מאות אלפי מעבדים שונים שעובדים ביחד

הדס ברטל |

דמיינו ארגון ענק שבו מאות אלפי עובדים שכולם עובדים עם מודלים שונים של AI בו זמנית, איך הארגון הזה יצליח לעבוד בלי להקריס את המערכת ואיך מתמודדים עם עלויות עצומות שיכולות להיות לשימוש הזה. אל תוך השאלה הזו נכנסת התשתית החדשה של גוגל ואנבידיה.

שירותי הענן של גוגל ביחד עם אנבידיה, מציגות ב-Google Cloud Next תשתית חדשה לאימון והרצת מודלים של AI בקנה מידה גדול משמעותית מבעבר. בכנס Google Cloud Next הציגו שתי החברות את הדור הבא של תשתיות האצה לענן, עם A5X bare metal instances המבוססים על מערכות אנבידיה-  NVIDIA Vera Rubin NVL72. המטרה המוצהרת של החברות עם הקמת התשתיות החדשות, היא הפחתת עלות ההרצה של מודלי בינה מלאכותית בקנה מידה גדול, ולהפוך את השימוש בסוכנים, בתרגום, בוידאו, קוד וסימולציות למשהו שחברות יכולות להריץ באופן שוטף ולא רק בניסוי. 

התשתית החדשה צפויה להוריד דרמטית את עלות ההרצה לכל טוקן, להגדיל תפוקה, לאפשר עבודה מאובטחת לארגונים רגישים, ולהעביר סוכני AI וסימולציות תעשייתיות מהמעבדה לייצור. טוקן, למי שפחות בקיא בעולם ה-AI, הוא יחידת טקסט בסיסית שהמודל “מבין” ומעבד, הוא יכול להיות מילה, חלק ממילה, מספר או אפילו אימוג'י.

לפי הכרזת החברות, השילוב בין חומרה ותוכנה צפוי לאפשר עלות נמוכה עד פי 10 לכל טוקן לעומת דורות קודמים, ובמקביל לאפשר תפוקת טוקנים גבוהה פי 10 לכל מגה ואט. תכונה זזו מעלה את הסוגיה הגדולה ב-AI, כאשר השאלה היא אינה רק אם אפשר לאמן מודל חזק, אלא כמה עולה להריץ אותו מיליוני פעמים ביום. בסוגיה זו מופיע חלק משמעותי בכלכלה של הענף, כאשר חומר הגלם הוא לא רק שבבים, אלא חשמל, קירור, רשתות ויעילות.

 

שיתוף פעולה בין גוגל ואנבידיה, קרדיט: ChatGPT
שיתוף פעולה בין גוגל ואנבידיה - קרדיט: ChatGPT

איך מחברים מיליון מעבדים לעבוד כמו מחשב אחד ענק?

כשעובדים עם מאות אלפי מעבדים במקביל, הבעיה אינה רק כוח גולמי, אלא תיאום מדויק. במקרים בהם נתונים מגיעים באיחור, או משימה נתקעת, או חלק מהמעבדים ממתינים למעבדים אחרים - הכסף נשרף. לכן ניהול עומסים, התאוששות מתקלות וסנכרון הופכים לחלק מרכזי מהתחרות בין ענני ה-AI.

האתגר הוא לחבר כמויות עצומות של מעבדים בלי ליצור צווארי בקבוק. A5X משלבת את מעבדי NVIDIA ConnectX-9 SuperNICs עם טכנולוגיית הרשת Virgo של גוגל. התצורה הזאת אמורה לאפשר חיבור של עד 80 אלף מעבדי אנבידיה באשכול יחיד, ועד 960 אלף GPU (מעבדים גראפיים) בפריסה רב אתרית.

קיראו עוד ב"BizTech"

 

אבטחה וריבונות נתונים

גוגל ואנבידיה מכוונות גם לשוק הארגוני הרגיש: בנקים, בריאות, ממשלות וחברות עם מידע קנייני. מודלים של ג'מיני ירוצו על מעבדי NVIDIA Blackwell ו-Blackwell Ultra במסגרת Google Distributed Cloud, כך שארגונים יוכלו להחזיק מודלים מתקדמים בתוך סביבה נשלטת משלהם, בקרבה לדאטה רגיש.

בנוסף, התשתית כוללת NVIDIA Confidential Computing, שמצפינה את המידע ברמת החומרה תוך כדי העבודה. המשמעות היא שגם ספקית הענן עצמה לא אמורה לראות או לשנות את הדאטה, הפרומפטים או נתוני האימון. זה קריטי לארגונים שנמנעו עד היום משימוש ב-AI בגלל חשש מחשיפת מידע.

 

תשתית AI לתעשייה רחבה והמונית

עוד נדבך הוא מעבד NVIDIA Nemotron 3 Super, שזמין כעת על Gemini Enterprise Agent Platform, המיועד לבניית סוכני AI המבצעים משימות מורכבות: תכנון, ניתוח, פעולה מול מערכות, עבודה עם API ונתונים. גוגל ואנבידיה מציעות גם Managed Training Clusters עם API, כדי להוריד מהחברות את הצורך לנהל בעצמן אשכולות, תקלות וגודל משאבים.

במקביל, החברות דוחפות חזק לתעשייה פיזית. ספריות Omniverse ו-Isaac Sim של אנבידיה זמינות בגוגל קלאוד ומאפשרות לבנות תאומים דיגיטליים, להריץ סימולציות של מפעלים, רובוטים וקווי ייצור, יחד עם בדיקת תהליכים לפני שמיישמים אותם בעולם האמיתי.

גוגל ואנבידיה מציעות במשותף את שכבת התשתית שבה AI אמור להפוך ממוצר ניסיוני למערכת תפעולית רחבה. מי שישלוט בעלות לטוקן, באבטחה, ברשתות ובניהול אשכולות ענק, ישלוט בחלק גדול מכלכלת ה-AI של השנים הקרובות.

 

הוספת תגובה

תגובות לכתבה:

הגב לכתבה

השדות המסומנים ב-* הם שדות חובה