
במשרדי ההייטק מפסיקים להקליד ומתחילים לדבר עם המחשב
שילוב תכתיב קולי עם מודלי בינה מלאכותית הופך מלמול מול המסך לשיטת עבודה יומיומית - והמשרד מתחיל להישמע כמו מוקד שירות
הטריק החדש של עובדים בענף הבינה המלאכותית כבר לא קשור לקיצורי דרך במקלדת או לתוספים לדפדפן, אלא לקול. יותר ויותר מפתחים, מנהלים ויזמים מפסיקים להקליד ומתחילים להכתיב למחשב לאורך היום. זה חוסך זמן, במיוחד כשמשלבים את התכתיב עם כלי קידוד מבוססי בינה מלאכותית, אבל משנה את הסביבה הפיזית והחברתית של העבודה: פחות שקט של מקלדות, יותר זמזום אנושי של אנשים שמדברים לעצמם מול המסך.
יזמת בתחום הבינה המלאכותית מסיאטל סיפרה שבשעות הערב, במקום לשבת בשקט מול הלפטופ לצד בן הזוג, היא התחילה ללחוץ על מקש הפונקציה ולהכתיב למחשב. מהר מאוד זה כבר לא היה "שקט" מבחינת מי שיושב ליד. התוצאה: עבודה בחדרים נפרדים, כדי לא להפוך את הסלון לעמדת שיחות.
במשרדים התופעה בולטת עוד יותר. משקיע הון סיכון תיאר ביקור בסטארט-אפים של בינה מלאכותית ככניסה למוקד שירות יוקרתי, רק שבמקום שיחות לקוחות - כולם מנהלים דיאלוג עם עוזר מבוסס מודל. עובדים בחברת הפינטק רמפ משתמשים באוזניות גיימינג שמאפשרות לדבר בקול מלא מול העמדה. בגוסטו, חברת ניהול השכר ומשאבי האנוש, המייסד השותף אדוארד קים מעודד ניסוי בתכתיב וטוען שמשרד העתיד יישמע יותר כמו רצפת מכירות מאשר כמו חלל עבודה שקט. לדבריו הוא מדבר עם המחשב כמעט כל הזמן, ומקליד רק כשאין ברירה.
החסם המרכזי הוא לא יכולת, אלא נורמות. אנשים שמדברים לעצמם במשרד זה עדיין דבר שנתפס מוזר, גם אם כולם מבינים שמדובר בשיחה עם תוכנה. חלק מנסים לפתור את זה בעזרת הקטנת ווליום, שימוש באוזניות כדי לחסום רעשי רקע, או בחירת אזורי עבודה פחות צפופים.
התכתיב כבר לא "טועה כל הזמן"
תכתיב קולי קיים שנים, אבל עד לא מזמן הוא נתקע בדיוק במקומות שבהם העבודה האמיתית מתחילה: ניסוחים מורכבים, פיסוק, מעבר בין שפה מקצועית לשפה טבעית, ותיקון טון. הגל הנוכחי מונע משילוב מודלים שמסוגלים לערוך טקסט כמעט בזמן אמת עם ממשקים שנבנים סביב הרגלי עבודה - כולל שימוש לצד כלים שמייצרים ומתקנים קוד כמו קלוד קוד וקודקס. אפשר לדבר בצורה חופשית, כמעט זרם תודעה, ולקבל בחזרה טקסט מסודר בתוך שניות.
אחת האפליקציות שמזוהות עם הטרנד היא ויספר פלו, שצוברת קהל משתמשים נאמן. ריד הופמן, ממייסדי לינקדאין, הגדיר את עצמו כמי שעבר לגישה הזו באופן מלא - ביטוי שמראה עד כמה זה הפך לזהות מקצועית בקרב קבוצה מסוימת בעמק הסיליקון.
כמו בכל טרנד פרודוקטיביות, גם כאן נוצרים אביזרים מסביב. משתמשים רוכשים פדלים לרגל מעולם הגיימינג כדי להפעיל את ההקלטה בלי הידיים. אחרים מחזיקים על השולחן מיקרופון צוואר גמיש בסביבות 60 דולר, מהסוג שמוכר מבמות ושידורי ספורט, כדי לשפר קליטה ולצמצם שגיאות.
התחרות מחריפה. לצד ויספר מופיעים שמות שמנסים לתפוס נתח מהקטגוריה: אקווה וויס ווילואו שנתמכות על ידי Y Combinator, וגם טוקטסטיק, טייפלס וסופרוויספר. ריבוי המתחרים מרמז שמדובר בשוק שמתחיל להתבסס סביב הרעיון שהקול הוא ממשק עבודה מרכזי, בדומה למגמות נוספות שמעצבות את עתיד סביבת העבודה.
הסיפור של ויספר עצמו התחיל בכיוון אחר. החברה הוקמה ב-2021 במטרה לפתח התקן לביש עם ממשק עצבי שאוסף אותות מוחיים לשליטה במחשב או בטלפון. בסופו של דבר היא התגלגלה למוצר תוכנה שמקשיב לקול ומשפר אותו בזמן אמת. גם כשהחזון הוא מדע בדיוני, ההזדמנות העסקית נמצאת לפעמים בפתרון הרבה יותר מיידי - כזה שמתחבר לאיך שאנשים עובדים עכשיו.
השאלה המעשית שמעסיקה מנהלים ועובדים היא פחות אם זה יעיל, ויותר איך חיים עם זה במשרד. יעילות אישית עולה, אבל ברגע שכמה אנשים באותו חלל מתחילים למלמל לעוזר שלהם במקביל, סביבת העבודה משתנה לגמרי.