deepseek
צילום: טוויטר
מהפכת ה-AI

מה זה DeepSeek? המודל הסיני שמטלטל את עולם הבינה המלאכותית

אדיר בן עמי | (6)
נושאים בכתבה מהפכת ה-AI


DeepSeek: מה הסיפור הגדול כאן?

DeepSeek הוא מודל שפה חדשני שפותח על ידי מעבדה סינית ומציג ביצועים מרשימים במיוחד שעשויים לשנות את כללי המשחק בשוק הבינה המלאכותית ולהשפיע משמעותית על השווקים. מדובר במתחרה ישיר למודלים המובילים בעולם כמו ChatGPT של OpenAI, קלאוד של אנתרופיק ו-ג'ימיני של גוגל ואף הדיח את ChatGPT מההובלה בחנות האפליקציות. המודל האחרון של החברה, DeepSeek R1, משלב יכולות מתקדמות של הבנה לוגית, ניתוח מידע, ואף יצירת תוכן.


אבל החידוש הגדול הוא לא רק בביצועים – אלא בעלות וביעילות הפיתוח. DeepSeek טוענת שהמודל הבסיסי שלה, V3, פותח תוך פחות משני חודשים, בעלות של פחות מ-6 מיליון דולר, תוך שימוש ב-2,048 שבבים בלבד מסוג H800 של אנבידיה – שבבים בעלי ביצועים מוגבלים יחסית לשבבי H100 שבהם משתמשות חברות אמריקאיות. אם זאת, ברשת רצות שמועות שהחברה אכן השתמשה בשבבי H100 של אנבידיה לאימון המודלים, אך לא יכולה להודות בכך בעקבות המגבלות של ארה"ב.


כדי להדגים את יכולותיו של המודל החדש, הוצגה בפניו שאלה מורכבת: מי היה השחקן הטוב יותר בשיא הקריירה שלו - מייקל ג'ורדן או לברון ג'יימס? המודל ניהל דיון פנימי מעמיק באורך 900 מילים, בחן את הקריירות של שני השחקנים, וניתח את המשמעות של המושגים "שיא" ו"טוב יותר", לפני שהגיע למסקנה מאוזנת.


אך מה שמייחד את DeepSeek R1 אינו רק יכולותיו, אלא העלות המפתיעה של פיתוחו. על פי טענות החברה, המודל הבסיסי שעליו מבוסס R1, המכונה V3, פותח בעלות של פחות מ-6 מיליון דולר ובתוך חודשיים בלבד, תוך שימוש ב-2,048 מאיצי בינה מלאכותית. יתרה מכך, העלות לשימוש ב-API של R1 נמוכה פי 27 מזו של המתחרה המובילה.



איך DeepSeek משנה את חוקי המשחק?

  1. עלויות פיתוח זולות במיוחד
    בעוד שחברות כמו מטא, מיקרוסופט וגוגל משקיעות מאות מיליוני דולרים בפיתוח מודלים גדולים, DeepSeek הראתה שאפשר להגיע לתוצאות דומות בהרבה פחות כסף. מטא, לדוגמה, השקיעה פי 14 יותר מ-DeepSeek בפיתוח המודל שלה, Llama 3.1, תוך שימוש בכ-16,000 שבבים מתקדמים.

  2. קוד פתוח לכולם
    DeepSeek הפכה את המודל שלה לזמין בקוד פתוח, תחת רישיון MIT המאפשר לכל מפתח ברחבי העולם להשתמש בו, לשפר אותו ולבחון אותו. גישה זו הופכת את הטכנולוגיה לנגישה יותר, ומאפשרת למתחרים ללמוד ממנה ולחקות אותה.

  3. גישה חינמית וזולה למשתמשים
    בעוד שגישה למודלים כמו GPT-4 של OpenAI יכולה לעלות בין 240 ל-2,400 דולר בשנה, DeepSeek מציעה את הממשק שלה בחינם לחלוטין. למפתחים שמעוניינים לבנות אפליקציות על בסיס המודל, עלות השימוש ב-API שלה זולה פי 27 מזו של OpenAI.

    קיראו עוד ב"גלובל"


ההשפעות הכלכליות והעסקיות

אם ההצהרות של DeepSeek מדויקות, ההשלכות על שוק הבינה המלאכותית עשויות להיות דרמטיות:
  1. פגיעה בחברות שבבים
    אנבידיה, שבשנתיים האחרונות מכרה שבבים בשווי של כ-131 מיליארד דולר למרכזי נתונים, עלולה לראות ירידה חדה בביקוש. חברות ענק כמו TSMC (יצרנית השבבים מטייוואן) ומיקרון (מובילה בייצור זיכרונות) עלולות להיפגע גם הן.

  2. קיצוץ השקעות במרכזי נתונים
    חברות כמו אמזון, מיקרוסופט וגוגל, שהשקיעו יחד 343 מיליארד דולר בשנתיים האחרונות במרכזי נתונים, ייאלצו לבחון מחדש את האסטרטגיה שלהן. אם ניתן לפתח מודלים מתקדמים בעלויות נמוכות, ייתכן והצורך בהשקעות עתק יפחת משמעותית.

  3. תחרות מוגברת בענן
    הירידה בעלויות הפיתוח וההפעלה עשויה להוביל להוזלת מחירי שירותי הענן, מה שיפגע ברווחיות של ספקיות ענן כמו מיקרוסופט ואמזון.

אם אכן ניתן לפתח מודלים מתקדמים בעלות נמוכה משמעותית, כפי שטוענת DeepSeek, המשמעות היא שהשוק עלול לעבור במהירות ממצב של מחסור במשאבי מחשוב לעודף היצע. הדבר עלול להוביל לקיצוץ בהשקעות העתידיות של ענקיות הטכנולוגיה ולפגוע בשרשרת האספקה כולה.


כדאי לציין כי המודל הסיני מעורר גם שאלות לגבי צנזורה וביטחון מידע. נושאים רגישים בסין, כמו כיכר טיאננמן והמיעוט האויגורי, מצונזרים במודל, ולא ברור אם קיימות מגבלות נוספות על תכנים פוליטיים. אם המודל יצבור פופולריות בארה"ב, הוא עלול למשוך תשומת לב ביקורתית דומה לזו שמושך TikTok.


שאלות ותשובות

מה הופך את DeepSeek למודל פורץ דרך?
DeepSeek הצליחה להוכיח שמודל AI מתקדם יכול להיבנות בצורה יעילה וזולה משמעותית בהשוואה למה שהכרנו עד היום. לדוגמה, בעוד שמודלים כמו GPT-4 של OpenAI מצריכים אלפי שבבים חזקים ועשרות מיליוני דולרים, DeepSeek הצליחה להגיע לאותם ביצועים עם 2,048 שבבים בלבד ובעלות מזערית של פחות מ-6 מיליון דולר.


איך הקוד הפתוח משפיע על התעשייה?
שחרור הקוד של DeepSeek בקוד פתוח מאפשר לכל מפתח בעולם לגשת לטכנולוגיה, ללמוד ממנה ולשפר אותה. זה יכול להאיץ חדשנות, אך גם להוביל לירידת מחירים ולתחרות מוגברת, מה שעלול לפגוע במובילות השוק הנוכחיות כמו OpenAI ומטא.


מה ההשפעה על חברות כמו אנבידיה?
אנבידיה, שנחשבת למובילה בתחום שבבי הבינה המלאכותית, עלולה להיפגע אם פחות שבבים יידרשו לפיתוח מודלים. השוק עשוי לעבור ממחסור בכוח מחשוב לעודף, מה שיכול להוריד את הביקוש לשבבים המתקדמים שלה.


איך DeepSeek מתמודדת עם בעיות צנזורה?
כמודל שפותח בסין, DeepSeek כפופה למגבלות צנזורה שמוטלות על תכנים רגישים כמו אירועי טיאננמן או טייוואן. אם המודל יצבור פופולריות במדינות המערב, הוא עשוי לעורר חששות פוליטיים בדומה ל-TikTok.


האם הטכנולוגיה הזו תחסל את שוק הבינה המלאכותית כפי שאנו מכירים אותו?
אם DeepSeek אכן עומדת בהצהרות שלה, היא עשויה לשנות את השוק לחלוטין. המודל שלה מראה שאין צורך בהשקעות עתק כדי להפיק תוצאות מרשימות, מה שיכול להוביל להתייעלות בשוק, אך גם לערער את הבסיס הכלכלי של החברות המובילות בתחום כיום.


האם DeepSeek יכולה להשתלב במכשירים קטנים?
בהחלט. המודל של DeepSeek מותאם גם למכשירים בעלי כוח מחשוב מוגבל, מה שיכול להפוך אותו לנגיש יותר לשימושים אישיים ולספק יתרון משמעותי בשוק הטכנולוגיה הצרכנית.


תגובות לכתבה(6):

הגב לכתבה

השדות המסומנים ב-* הם שדות חובה
  • 4.
    לרון 28/01/2025 11:15
    הגב לתגובה זו
    לא צריך מיד לזנק ב DAY ONEזו הבעייהתזזיתיותלא מחכים יומייםחודשיים ואין סבלנות לשום ולדבר!
  • 3.
    צחי 28/01/2025 11:13
    הגב לתגובה זו
    מעניין ..פירסמו שבוע אחרי שטרמפ נכנס לתפקיד ...לא מאמין לסינים הזייפנים הכל פייק ...לקנות אנבידאה לקנות סחורה אמריקאית הסינים זייפנים ושקרנים
  • 2.
    סודי 28/01/2025 10:11
    הגב לתגובה זו
    עד הפעם הבא!
  • 1.
    שי 28/01/2025 08:34
    הגב לתגובה זו
    אני כמובן מניח שהם לא ממתי הסינים משקרים לעולםואם הם לא משקרים סהכ חדשות טובות לעולם שמאמין ב AI.יהיה נגיש וזול יותר ויבזבז פחות אנרגיה.ליבי כמובן עם החברות הגדולות בתחום שהמניות שלהן יורדות ועם המשקיעים.
  • שלטון הערב רב 28/01/2025 10:34
    הגב לתגובה זו
    זה כל חברות הטכנולגיה הגדולות שעכשיו מתמוטטותכי היה נוח להם לעשות הון כספי במממדים לא נתפסיםלנפח בועה וילצור קרטל שמכניס להם כסף ללא סוףזה סופה של כל בועה להתפוצץ ברעש גדול מאוד!!!
  • צחי 28/01/2025 11:15
    הסינים זייפנים ושקרנים ואתה תמים במקרה הטוב
אילון מאסק וג'נסן הואנג (אנבידיה)אילון מאסק וג'נסן הואנג (אנבידיה)

אילון מאסק = 2 מיליון ישראלים = 1 מיליון אמריקאים

ההון של מאסק, האיש העשיר בעולם - כ-500 מיליארד דולר - שקול להון של 2 מיליון ישראלים. לא נתפס

מנדי הניג |
נושאים בכתבה אילון מאסק


אילון מאסק שווה כ-500 מיליארד דולר. רוב ההון מגיע מההחזקה בטסלה, אבל יש לו גם שווי מאוד משמעותי בספייסX שצפויה להנפיק בטווח של שנה-שנתיים והיא החברה הפרטית הכי גדולה בעולם עם שווי של מעל 500 מיליארד דולר. לאחרונה היו דיווחים על עסקאות בשווי של 800 מיליארד דולר, אך מאסק טען שזה לא נכון. בכל מקרה, זו חברה עשויה להנפיק לפי שווי של 800 מיליארד עד 1.2 מיליארד דולר, אולי יותר, תלוי כמובן במצב השווקים. אם זה יקרה, מאסק כבר יהיה שווה 700-800 מיליארד דולר, וצריך גם לזכור שיש לו חבילת הטבות ענקית מטסלה, אם יעמוד ביעדים.

כלומר, העושר עשוי לגדול, אבל כמובן שגם לרדת. אם נתייחס לעוגן - השווי הנוכחי של 500 מיליארד דולר, נקבל שהונו שקול להון של 1 מיליון אמריקאים ו-2 מיליון ישראלים. לא נתפס.

הון של 500 מיליארד דולר

ההון של מאסק מבוסס בעיקר על החזקותיו בחברות טסלה וספייסX: שיעור של 19.8% ממניות טסלה בשווי כ-290 מיליארד דולר, ו-42% מספייסX בשווי 190 מיליארד דולר, בתוספת החזקות ב-XAI ובחברות אחרות. מאסק, בן 55, הפך לאדם העשיר בעולם לפני כשנה וחצי.

העושר הממוצע לאדם בוגר בארה"ב עומד על כ-550 אלף דולר  - מה ההון הממוצע של ישראלי ומה ההון של אמריקאי? וזה כולל נכסים פיננסיים, נדל"ן וחובות נטו. ההון של מאסק שקול לזה של 900 אלף אמריקאיים. ביום טוב זה מגיע למיליון. 

השוואה זו מדגישה את אי-השוויון בארה"ב, שם 10% העליונים מחזיקים ב-70% מהעושר הכולל, בעוד 50% התחתונים מחזיקים ב-2.5% בלבד. 

ריביאן אתר החברהריביאן אתר החברה

ריביאן חושפת שבב חדש ומערכת נהיגה אוטונומית בתשלום

יצרנית הרכבים החשמליים מציגה שבב עיבוד עצמאי, חבילת נהיגה מתקדמת בתשלום ומערך ליידאר בדגמי R2, אך המשקיעים מודאגים מהעלויות ומהקצב האיטי של הייצור; המניה נופלת ב-4.5%

אדיר בן עמי |

ריביאן Rivian Automotive -6.11%  חשפה שורה של מהלכים טכנולוגיים חדשים במטרה לחזק את מעמדה בשוק הרכב החשמלי ולבסס יכולות נהיגה מתקדמות בכלי הרכב העתידיים שלה. במסגרת אירוע ייעודי שעסק באוטונומיה ובינה מלאכותית, הציגה החברה לראשונה שבב עיבוד שפותח באופן עצמאי, מערכת סיוע לנהג בתשלום, ותוכנית הדרגתית לשילוב מערכות נהיגה ברמות מתקדמות יותר.


הצעד המשמעותי ביותר הוא המעבר לשבב ייעודי שפותח בתוך החברה, מהלך שמחליף את השימוש במעבדי אנבידיה שהיו בלב מערכות הנהיגה של דגמי ריביאן עד כה. השבב החדש צפוי להתממשק עם מצלמות, חיישני ליידאר ומערכות נוספות, ולספק יכולת עיבוד גבוהה יותר מבעבר. בריביאן אומרים כי ההחלטה לבנות שבב עצמאי התקבלה לאחר שנים של פיתוח, וכי הוא ישפר משמעותית את ביצועי מערכת הנהיגה המתקדמת, תוך הפחתת עלויות הייצור. לטענת החברה, מדובר בשילוב נדיר בין שיפור ביצועים לבין הורדת עלויות, מהלך שאינו נפוץ בפיתוח שבבים לרכב.


החברה הציגה גם חבילה חדשה של סיוע לנהג, Autonomy+, שתוצע בתשלום חד-פעמי או כמנוי חודשי. החבילה תאפשר נהיגה ללא מגע ידיים במיליוני קילומטרים של כבישים בארה״ב וקנדה, ומיועדת להפוך למנוע הכנסה נוסף עבור החברה בתקופה של ביקוש מתון לרכבים חשמליים.


דגמי R2 החדשים ועוזר הבינה המלאכותית

דגמי ה־R2, הצפויים לצאת לשוק במחצית הראשונה של השנה הבאה, יצוידו בשבב החדש ובחיישני ליידאר מתקדמים. בכך מצטרפת ריביאן לשורה של יצרניות רכב ופתרונות רובוטקסי המשלבות ליידאר כמנגנון בטיחות ותפיסת מרחב נוסף. מנגד, הדגמים הנוכחיים, מסדרת R1, לא יזכו למלוא היכולות של הדור החדש, אך יקבלו שדרוגי תוכנה שירחיבו את היכולות הקיימות. חלק מהשדרוגים נועדו לשפר נהיגה ללא מגע ידיים, ואחרים יאפשרו ניווט מתקדם יותר כאשר הרכב עדיין מחייב השגחת נהג.


לצד פיתוח השבב, חשפה החברה עוזר בינה מלאכותית חדש המיועד לתפעל פונקציות ברכב, לסנכרן אפליקציות ולזהות תקלות פוטנציאליות. זהו צעד נוסף בכיוון של שילוב מערכות תוכנה מורכבות כחלק מהערך המסחרי של כלי הרכב.