אנתרופיק קלוד (X)
אנתרופיק קלוד (X)

28 מיליון הודעות מ-25 אלף חשבונות מזויפים: כך מעתיקים את קלוד

חברות הבינה המלאכותית האמריקאיות טוענות שמתחרים סיניים אוספים תשובות ממודלים מתקדמים ומאמנים בעזרתן מערכות זולות, בשיטה שנקראת דיסטילציה - והנתונים שפורסמו מצביעים על פעילות בקנה מידה תעשייתי.

ענת גלעד |
נושאים בכתבה קלוד OpenAI

אנתרופיק ו-OpenAI מאשימות מתחרים מסין בשימוש בשיטת הדיסטילציה כדי לשכפל יכולות של מודלים מתקדמים בלי לשלם את עלויות הפיתוח המלאות. לטענתן, שחקנים סיניים אוספים כמויות גדולות של תשובות ממודלים כמו קלוד של אנתרופיק, ואז משתמשים בהן כדי לאמן מערכות מתחרות שמוצעות במחיר נמוך יותר או אפילו בחינם.

השיטה עצמה אינה חדשה. מודל גדול משמש כ"מורה" ומספק תשובות לשאלות רבות, והמידע משמש אחר כך לאימון מודל קטן יותר. התוצאה היא מוצר שמדמה חלק ניכר מהיכולות המקוריות, אך עולה פחות להרצה וניתן להפיץ אותו ביתר קלות.

בשוק שבו חברות אמריקאיות השקיעו עשרות ומאות מיליארדי דולרים במרכזי נתונים ובכוח חישוב, היכולת לייצר חלופות זולות יוצרת לחץ ישיר על המודל העסקי. במקום לגבות תשלום עבור גישה למודל מתקדם, מתחרים יכולים להציע שירות דומה בעלות נמוכה בהרבה.

אנתרופיק ו-OpenAI טוענות כי חלק מהפעילות נעשתה ללא הרשאה ובקנה מידה תעשייתי. לפי נתונים שפורסמו, בין אפריל ליוני נרשמו יותר מ-28 מיליון חילופי הודעות עם קלוד דרך כ-25 אלף חשבונות מזויפים, שיוחסו לעליבאבא. מקרים נוספים דווחו מול מעבדות כמו דיפסיק ומינימקס.

מעבר להיבט הכלכלי, החברות האמריקאיות מצביעות על סיכון בטיחותי. מודלים שמועתקים בדרך זו עלולים להגיע עם פחות מגבלות שנועדו למנוע שימושים אסורים, כגון יצירת תוכן הקשור לנשק ביולוגי או לתקיפות סייבר.

למה קשה לחסום

הקושי המרכזי נעוץ בכך שקשה להוכיח באופן חד משמעי שמודל מסוים נבנה על בסיס תשובות שנאספו ממודל אחר. חברות יכולות לזהות דפוסי שימוש חריגים, כמו נפחי שאילתות גבוהים מכתובות אינטרנט חשודות, אך אין דרך פשוטה לדרוש הצגת נתוני אימון.

חלק מהמעבדות הסיניות מפרסמות מודלים עם משקל פתוח, מה שמקל על משתמשים להריץ אותם באופן עצמאי. מולן, השחקנים האמריקאים הגדולים שומרים על מודלים סגורים ומכניסים הכנסות בעיקר דרך מנויים וממשקי תוכנה.

הנושא הגיע גם לדיון פוליטי. באפריל מסר הבית הלבן כי יפעל עם התעשייה כדי לרסן את התופעה, וחברי קונגרס רפובליקנים העלו אפשרות להטיל סנקציות על גופים שיבצעו דיסטילציה תעשייתית לצורך בניית מתחרים.

בשלב זה לא ברור כיצד יתפתחו הצעדים המעשיים. חברות מדברות על שיתוף מידע בין פלטפורמות ועל שיפור זיהוי חשבונות פיקטיביים, אך החסימה המלאה נותרת מורכבת משום שהשירותים נועדו מלכתחילה לשרת כמויות גדולות של משתמשים.

הוספת תגובה

תגובות לכתבה:

הגב לכתבה

השדות המסומנים ב-* הם שדות חובה