הסוכן החדש של OpenAI עושה הרבה - אך עלול להיות זדוני
שירות Operator שהשיקה החברה בינואר באופן מוגבל בארה"ב, נפתח מאז לעוד שווקים, ומסוגל לעזור במגוון פעולות יומיומיות למשתמשים. ואולם בידיים הלא נכונות הוא עלול לשמש לביצוע הונאות כמו פישינג, והחברה צריכה להוכיח שלא מדובר בפרצה גדולה מדי
בינואר האחרון חשפה OpenAI את Operator - סוכן בינה מלאכותית עצמאי שמסוגל לבצע משימות באינטרנט באופן אוטונומי, ללא צורך במעורבות אנושית מתמשכת. המערכת מבוססת על מודל חדש בשם CUA (Computer-Using Agent), שמשלב יכולות ראייה של GPT-4o עם אינטראקציה גרפית, ומאפשרת ל-Operator לנווט באתרים, למלא טפסים ולבצע פעולות באופן עצמאי.
Operator מתפקד כעוזר אישי דיגיטלי, שמסוגל לבצע משימות כמו הזמנת טיסות ובתי מלון, קניות באתרים כמו Instacart ו-Etsy, הזמנת מוניות דרך אובר, הזמנת שולחנות במסעדות באמצעות OpenTable, ומילוי טפסים והגשת דו"חות של הוצאות. המערכת פועלת באמצעות דפדפן וירטואלי, שבו ניתן לצפות בפעולותיה בזמן אמת. במקרים שדורשים הזנת פרטי תשלום או סיסמאות, Operator מבקש מהמשתמש להתערב, כדי להבטיח אבטחה ודיוק.
היתרון המרכזי של Operator הוא היכולת לחסוך זמן על ידי אוטומציה של משימות יומיומיות, עם יכולת לבצע כמה משימות במקביל והתאמה אישית לצרכים שונים. עם זאת, המערכת עשויה להתמודד עם אתגרים כשהיא נתקלת באתרים מורכבים או לא סטנדרטיים, ולעתים דורשת התערבות אנושית במקרים מסוימים. בנוסף, הזמינות של השירות מוגבלת מבחינה גיאוגרפית בשלב זה. Operator היה זמין בהתחלה רק למנויי ChatGPT Pro בארה"ב ובבריטניה, בעלות של 200 דולר לחודש, אך לפני כחודש הזמינות שלו הורחבה למדינות נוספות, בהן הודו ואוסטרליה. OpenAI מתכננת להרחיב את הזמינות של השירות גם למנויי Plus, Team ו-Enterprise בהמשך.
גם לגוגל ואנתרופיק יש מוצרים דומים
כמה חברות מציעות שירותים דומים: גוגל עם Project Mariner; אנתרופיק עם כלי אוטומציה לדפדפן; אמזון עם Nova, סוכן AI המתמקד בקניות מקוונות; ו-Manus, סוכן AI סיני שמסוגל לבצע משימות מורכבות באופן עצמאי. בנוסף, קיימות חלופות של קוד פתוח כמו AutoGPT ו-Open Operator, שמציעות יכולות דומות.
- "ל-OpenAI יש חור תזרימי של 207 מיליארד דולר"
- היום שבו הוקמו ענקית נפט, ענקית ביטחון וצ'אט ששינה את החיים של כולנו
- המלצת המערכת: כל הכותרות 24/7
OpenAI מתכננת להשיק API ל-Operator, שיאפשר למפתחים ולחברות ליצור פתרונות אוטומציה שמותאמים אישית. החברה רואה ב-Operator צעד משמעותי לקראת עתיד שבו סוכני AI ישולבו בעבודה היומיומית, וישפיעו על תחומים כמו שירות לקוחות, מכירות ופיננסים. למרות האתגרים הקיימים, Operator מציג פוטנציאל לשנות את הדרך שבה אנו מבצעים משימות באינטרנט, ולהפוך את האינטראקציה הדיגיטלית ליעילה ואוטומטית עוד יותר.
לפי דיווחים שפורסמו בכמה מקומות, כבר בוצעו ניסויים שמטרתם להדגים כיצד ניתן לנצל את Operator לרעה, אם כי מדובר בשלב זה בעיקר בהוכחות היתכנות ולא במתקפות בקנה מידה רחב. כך למשל, חוקרי אבטחת מידע הצליחו להנחות את Operator לבצע פעולות לא מכוונות כמו לחיצה על קישורים זדוניים, שליחה של מידע רגיש לאתרים חשודים, או אפילו התחלה של תהליך רכישה מזויף - וכל זאת בלי שהמערכת תזהה בזמן אמת שהמשימה עצמה אינה לגיטימית. במקרים מסוימים, סוכנים כמו Operator התקשו לזהות ניסיונות התחזות, בייחוד כשהממשק הגרפי היה בנוי כך שייראה אמין.
OpenAI עצמה הודתה בקיומן של חולשות כאלה, והצהירה כי מדובר בשלב ניסיוני שבו החברה לומדת את מגבלות הטכנולוגיה ומטמיעה שכבות הגנה נוספות. החברה גם פועלת בשיתוף עם מומחי סייבר כדי לזהות מראש תרחישים פוטנציאליים של שימוש לרעה, ומיישמת מסננים, ניטור בזמן אמת ובקשות לאישור מפורש מהמשתמש כשמזוהים תרחישים חריגים. כמו בכל טכנולוגיה מהפכנית, יש פער בין היכולות לבין האתיקה והבקרה הדרושים, וההתמודדות עם פגיעויות ושימוש לרעה תמשיך ככל ש-Operator ייכנס לשימוש רחב יותר ויותר.
- טכנולוגית AI ישראלית לניתוח צילומי אויר, תשמש להערכת עמידות מבנים ביפן בפני שריפות ואסונות טבע
- מנהלים רוצים בינה מלאכותית, העובדים עדיין מהססים
- תוכן שיווקי שוק הסקנדרי בישראל: הציבור יכול כעת להשקיע ב-SpaceX של אילון מאסק
- הקץ של האינטרנט כפי שהכרנו: איך הבינה המלאכותית עלולה לחסל...
בקרוב גם ב-WhatsApp?
האם Operator מבוסס על אותו המנוע של ChatGPT או שיש כאן טכנולוגיה שונה?
Operator מבוסס על מודל ה-GPT-4o החדש של OpenAI, אך בשונה מגרסאות ChatGPT הרגילות, הוא כולל שילוב של ראייה ממוחשבת ויכולת ניווט בזמן אמת בסביבות גרפיות כמו דפדפנים. כלומר, במקום רק להתכתב אתו, הוא גם ממש "רואה" את הממשק שעליו הוא פועל - כפתורים, טפסים, שדות טקסט - ויודע לתפעל אותם בדומה לאדם.
האם ניתן לתת ל-Operator גישה למייל או למסמכים אישיים כדי שיבצע משימות מתקדמות יותר?
נכון להיום, Operator לא מקבל גישה ישירה לתיבת הדואר האלקטרוני של המשתמש או למסמכים פרטיים, אלא אם המשתמש מעניק לו גישה מפורשת כחלק מתהליך המשימה (כך לדוגמה, במילוי טופס שדורש מידע מהמייל). OpenAI מדגישה את נושא הפרטיות והביטחון, ולכן כל גישה כזו דורשת אישור אקטיבי ומודע של המשתמש.
מה לגבי התממשקות לאפליקציות צד שלישי כמו WhatsApp או סלאק?
בשלב הזה Operator מתמקד בעיקר באינטראקציה עם דפדפנים ואתרים באינטרנט הפתוח. התממשקות לאפליקציות צד שלישי כמו WhatsApp, סלאק, זום או תוכנות מקומיות אחרות אינה חלק מהיכולות המובנות. ואולם לפי ההצהרות של OpenAI, בעתיד ייתכן ש-API פתוח יאפשר חיבור של Operator לפלטפורמות נוספות, כולל שירותי צ’אט, ענן, ויישומים עסקיים.
האם יש סכנות בשימוש ב-Operator, כמו למשל שימוש לרעה?
אחת הסוגיות שמטרידות את קהילת האבטחה היא האפשרות שסוכני AI כמו Operator ינוצלו על ידי גורמים עוינים לצורך פישינג, התחזות או הונאות מקוונות. כבר דווחו ניסויים בהוכחת היתכנות למתקפות שבהן Operator שוכנע לבצע פעולות לא לגיטימיות באתרים שונים. OpenAI מצהירה שהיא שמה דגש רב על פיקוח, בקרות אתיות ומנגנוני בטיחות, אך כמו כל טכנולוגיה - גם כאן יש מקום לדאגה, בייחוד אם הכלי יגיע בעתיד לידיים לא נכונות.
איך תתמודד OpenAI עם עומס על השרתים, ככל שיותר משתמשים יבקשו להריץ משימות דרך Operator?
OpenAI פועלת על בסיס תשתיות הענן של מיקרוסופט Azure, ולטענתה יש לה את היכולת להרחיב את הקיבולת בהתאמה לצרכים. עם זאת, יש לקחת בחשבון ש-Operator צורך משאבים גדולים יותר ממערכת שיחה רגילה כמו ChatGPT, מכיוון שהוא מבצע סימולציה של ממשק משתמש גרפי ומנתח את הסביבה באופן מתמשך. החברה בוחנת מודלים של תעדוף, כולל מחיר גבוה יותר וגישה מדורגת, כדי למנוע עומס על המערכת.
סם אלטמן. קרדיט: רשתות חברתיות"ל-OpenAI יש חור תזרימי של 207 מיליארד דולר"
ניתוח של HSBC מלמד שלמובילה בתחום ה-AI יש יותר שימושים ממקורות והיא תצטרך לגייס הון, חוב או להקטין את התשלומים שלה בדרכים יצירתיות (כמו הנפקת מניות)
HSBC פרסם ניתוח כלכלי מקיף, המעריך כי OpenAI עומדת בפני פער מימון עצום של כ־207 מיליארד דולר עד שנת 2030. הפער נובע בעיקר מהוצאות אדירות על תשתיות ענן, חוות שרתים, רכישת קיבולות עיבוד גדולות וחוזי שכירות ארוכי טווח. הניתוח, שפורסם על ידי צוות אנליסטים של הבנק בהובלת ניקולס קוט־קוליסון, מבוסס על חוזים קיימים של OpenAI עם ענקיות טכנולוגיה כמו מיקרוסופט (250 מיליארד דולר) ואמזון (38 מיליארד דולר), וכן עם אורקל (300 מיליארד דולר). עלויות אלה צפויות להגיע ל־1.4 טריליון דולר בחישוב כולל עד 2033, כולל 620 מיליארד דולר על השכרת מרכזי נתונים בלבד.
הדוח מדגיש כי ללא זרימת מזומנים חדשה, OpenAI תיתקל בבעיית מזומנים, אך האנליסטים מסבירים שלחברה יש אפשרויות כמו גיוסים ועסקאות שונות עם לקוחות וספקים. למעשה, ההשקעה הענקית בתשתיות היא הבעיה של חלק גדול מהחברות בתחום. הן משקיעות בידיעה שהתשואה רחוקה. ראינו כאן את הפער הענק בין ההשקעות של כל ענקיות הטק בתשתיות AI ובין התשואה הנמוכה שהן יפיקו בשנים הבאות - מה מאיים על מהפכת ה-AI?
OpenAI, מדווחת על כ־800 מיליון משתמשים חודשיים ועדיין תזרים המזומנים הנוכחי שלילי כשלא מפורסם עד כמה הוא שלילי, אך סיכוי טוב שמדובר על כמה עשרות מיליארדי דולרים. האנליסטים מציינים כי אפילו בתסריטים אופטימיים, כולל כיסוי 10% משוק הפרסום הדיגיטלי, ההכנסות לא יכסו את ההוצאות.
הפער בין המקורות לשימושים מבוסס על התחייבויות קונקרטיות. HSBC מעריכה כי עלויות החישוב לבדן יגיעו ל־792 מיליארד דולר בין סוף 2025 ל־2030, כאשר OpenAI שואפת ל־36 גיגאוואט של כוח חישוב, כמות חשמל שמספיקה לכ־27 מיליון בתים פרטיים, שווה ערך לצריכת מדינה בגודל טקסס. חוזי השכירות מתפרסים על פני שנים רבות, והם כוללים תשלומים קבועים ללא קשר לביקוש בפועל. במקביל, ההכנסות, מדמי מנוי (כ־20 דולר לחודש למשתמשים בתשלום), API לשירותים עסקיים ושירותים נוספים, צפויות לצמוח ל־213 מיליארד דולר ב־2030, אך זה עדיין משאיר פער מצרפי של 207 מיליארד.
- היום שבו הוקמו ענקית נפט, ענקית ביטחון וצ'אט ששינה את החיים של כולנו
- OpenAI מתרחבת והשותפות מממנות: כך החברה מתקדמת לעבר AGI
- המלצת המערכת: כל הכותרות 24/7
האפשרויות לסגירת הפער הן כאמור גיוס הון דרך סבבי השקעה פרטיים או מוסדיים, כפי שקרה בסבב האחרון של 40 מיליארד דולר בהערכת שווי של 300 מיליארד. אפשרות נוספת - הלוואות מבנקים או אגרות חוב, עם שעבוד על נכסים כמו דאטה סנטרים, אך HSBC מזהיר כי שוק החוב הנוכחי קשה לחברות טכנולוגיה לא רווחיות. שלישית, הגדלת הכנסות: מעבר למודלים כמו פרסום ממוקד AI, ושירותים לארגונים וכלים לעסקים. אפשרות נוספת - משא ומתן מחדש על חוזים, הפחתת קיבולת או מעבר לחישובים פנימיים יעילים יותר. וגם כאמור אפשרות של השקעה בתמורה לסחורה ושירותים - אנבידיה השקיעה בחברה ותספק לה שבבי AI שחלק מהעסקה.
