העתיד כבר כאן! הכירו את טכנולוגיית TTS לזיהוי והפקת דיבור
האם האמנת שאי פעם תוכל לתת למחשב להקריא לך את היצירה הספרותית האהובה עליך?המדע הבדיוני הזה, כבר קיים בשנת 2018! טכנולוגיית TTS מתקדמת בצעדי ענק והיא כאן כדי להישאר!
טכנולוגיית TTS הינה מערכת טקסט לזיהוי והפקת דיבור הקולטת אינפוט, מזהה ומנתחת אותו לא רק בכל הנוגע למילים בודדות, אלא עבור משפטים שלמים ואף טקסטים ארוכים ומורכבים.
במאמר זה נבדוק מה המשמעות של המערכת, לאיזה שימושים היא יעילה ומהם הצרכים להם היא מספקת מענה מיטבי.
אז מהי מערכת טקסט לדיבור?
מערכת טקסט לזיהוי והפקת דיבור, כשמה כן היא – מערכת ממוחשבת שמסוגלת לפענח ולייצר דיבור אנושי.
במקרה של זיהוי דיבור יהיה קלט, שיגיע ממיקרופון במכשיר שאליו מדבר המשתמש או משיחה טלפונית נכנסת, והמערכת תזהה את התוכן או את זהותו של הדובר.
כך, ישנם ארגונים כמו קופות חולים, המאפשרים ללקוח להזמין תור לפגישה באמצעות מערכת שמפענחת את תכני הדיבור, וכן מוסדות בנקאיים, העושים שימוש בטכנולוגיה לצורך זיהוי הלקוח על פי קולו, במקום הקשת סיסמאות מסורבלת.
בנוסף, נעשה שימוש במערכת כסינטיסייזר שמפיקה ומייצרת באופן מלאכותי דיבור בקול אנושי, שיכלול מתקדם שפותח לראשונה לצרכי הנגשה למען אוכלוסיית לקויי הראייה.
איך מערכת לזיהוי והפקת דיבור פועלת?
״ישנן מערכות TTS שונות בשוק״ מציינת עדי כהן, מנהלת בחברת פייקול, ״חלקן מתבססות על שרשור מקטעי דיבור מוקלטים, המאוחסנים במסדר נתונים ייעודי, בעוד שהדגמים המתקדמים יותר הנם מכשירי סינטיסייזר לכל דבר, אשר מפיקים פלט של דיבור אנושי באמצעות מודלים חדשניים של מערכות קול".
מערכת מתקדמת של סינטיסייזר דיבור מורכבת משני מערכים: החזיתי והעורפי.
תפקיד המערך החזיתי הוא לעבד טקסט כתוב וגולמי כך שיהיה מוכן להקראה, על ידי המרת קיצורים, ראשי תיבות, מספרים וסמלים למקבילות כתובות בשפה המבוקשת.
בהמשך לכך, מחלק המערך החזיתי את הטקסט לחלקים תחביריים, כמו חלקי משפט ומשפטים, וליחידות פונטיות. בתום עיבודו של הטקסט, ממיר המערך העורפי את היחידות הפונטיות לצלילים קוליים וברורים, הניתנים להשמעה כפלט המדמה דיבור אנושי.
שימושים רווחים במערכות טקסט לדיבור ויתרונותיהן
״מערכות טקסט לדיבור אמנם הומצאו במקור לרווחתם של ציבור לקויי הראייה״, מציינת עדי, ״אך נמצאות כיום בשימוש רחב בשוק, וחולשות על תחומים מתרבים והולכים של יישומים שחורגים בהרבה מהנגשה לבעלי מוגבלויות בלבד. מוסדות חינוך ואקדמיה, גופי תחבורה ציבורית, אפליקציות ומשחקים בעולם הגיימינג כמו גם חברות וארגונים עסקיים מובילים – כולם משתמשים ומסתמכים על מערכות טקסט לדיבור בטכנולוגיית TTS".
- אג"ח למטרו: נת"ע בוחנת גיוס חוב לפרויקט בגוש דן
- ועדת השרים אישרה: מגבלות חדשות על שכר הטרחה בתביעות סיעוד של קשישים
- תוכן שיווקי שוק הסקנדרי בישראל: הציבור יכול כעת להשקיע ב-SpaceX של אילון מאסק
לפניכם שימושים עיקריים ויתרונות משמעותיים שטמונים במערכות טקסט לדיבור כיום:
מערכות TTS כטכנולוגיה המסייעת לתלמידים ולסטודנטים במוסדות הכשרה וחינוך
מבחנים מהווים, כידוע, גורם ללחץ ולסטרס עבור תלמידי בית ספר וסטודנטים גם יחד, כשלחץ הבחינות מקשה על חלק מהנבחנים לקרוא את ההוראות והשאלות שכלולות במבחן.
מערכת טקסט לדיבור מספקת דרך קלה ויעילה להמרת התוכן לקול, ו'מקריאה' לנבחן את שאלות הבחינה, על מנת למקסם את הישגיו הלימודיים.
יתרון משמעותי טמון בכך עבור ציבור ליקויי למידה המתקשים בקריאה, ואשר מערכת כזו יכולה לסייע להם ממשית במינוף הציונים, תוך אפשור של חוויית למידה מהנה, המשוחררת מתחושות תסכול מעיקות.
מערכות TTS כטכנולוגיה לקידום נגישות באינטרנט
בהתאם לחוק נגישות האתרים באינטרנט, שהוחל מחודש אוקטובר בשנת 2017, כל עסק שהכנסותיו השנתיות עולות על מיליון שקלים בשנה, או שאתר האינטרנט שלו הוקם לאחר מועד החלת החוק – מחויב להנגישו לציבור בעלי המוגבלויות.
חוק זה מבוסס על העיקרון לפיו על המרחב האינטרנטי להיות נגיש לכולם, לרבות לקויי למידה וראייה, ובעלי מוגבלויות נוספים כמו חולי פרקינסון.
״חשוב לדעת״, מציינת עדי, ״שבעלי המוגבלויות מהווים כחמישית מכלל אוכלוסיית הגולשים באינטרנט בישראל, מתוכם למעלה מ-23,000 עיוורים, בעוד שברחבי העולם ישנם כ-774מיליון איש המוגדרים כבעלי ליקויי אוריינות ו-285 מיליון עיוורים בקירוב, המהווים קהל יעד משמעותי ופוטנציאלי״.
מערכות הטקסט לדיבור מאפשרות לעיוורים להיחשף לתוכן על ידי הקראתו, ללקויי למידה להבין טוב יותר את המסרים הכלולים באתר האינטרנט, ולבעלי מוגבלויות מוטוריות כמו חולי פרקינסון – להפעיל את האתרים באמצעות קולם במקום בלחיצה על העכבר והמקלדת.
מערכות TTS בשירות עולם הגיימינג והבידור
אפליקציות שונות ובראשן 'ווייז' הידועה, לצד משחקי מחשב וגיימינג ואתרים בידוריים, עושים שימוש בטכנולוגיית TTS , לצורך המחשה ושיפור חווייתו של הגיימר או המשתמש.
כולנו כבר התרגלנו לקול האנושי שמנחה אותנו מהמכשיר הנייד מתי לפנות ולאן, עד להכרזה 'הגעת ליעד', ורבים מאתנו נהנים לשוחח עם דמויות בדיוניות בקווסטים ובמשחקי מציאות מדומה, תוך העצמת האשליה שאנו מדברים, לכאורה, עם בני אדם ממשיים.
מערכות TTS כטכנולוגיה המשפרת את השירות למשתמשים בתחבורה ציבורית
טכנולוגיית ה-TTS להפקת דיבור מקלה על מסירתן של הודעות לציבור הנוסעים, על מנת שיוכלו להשלים את נסיעתם בבטחה תוך קבלת מלוא המידע החיוני בזמן.
הודעות על איחור במועד הגעת הרכבת, שינוי במסלולו של קוו האוטובוס ואזכוריהם של כללי בטיחות בסיסיים, מושמעים באמצעות מערכת ה- TTS דרך רמקולים מרכזיים בכלי הרכב הציבוריים ובמתחמי התחנות, ומגיעים לציבור הנוסעים בזמן אמת, באופן נהיר וברור.
מערכות TTS ללימודי שפות ולרכישת כישורי אוריינות
אנשים הרוצים ללמוד שפה חדשה או לשפר את כישורי האוריינות שלהם יכולים לעשות זאת בקלות חסרת תקדים.
אחד המרכיבים החשובים ברכישת שפה חדשה, מבוסס על האזנה לצליליה וקליטה של זרימת המשפטים, אופן ההגייה הנכון ונימת הדיבור האופיינית.
מערכות טקסט לדיבור מאפשרות ללומדים שפה חדשה לקלוט אותה במהירות ובאופן מדויק, מבלי להסתמך על שירותיו של מורה אנושי.
בנוסף, מסייעות מערכות TTS לשיפור הדיקציה, בהירות ההתבטאות וכישורי האוריינות בקרב אנשים שנתקלים בקשיים בתחומים אלו, ומעוניינים לשדרג את יכולותיהם באופן עצמאי.
מערכות TTS ככלי עזר לציבור האילמים
נוסף על הסיוע המשמעותי שמערכות טקסט לדיבור מעניקות לציבור העיוורים, לקויי הלמידה ובעלי המוגבלויות המוטוריות, הם גם באים לעזרתם של ציבור האילמים.
כיום אילמים יכולים להקליד כל מסר שהם רוצים לומר, ולהשמיעו לבני שיחם על ידי לחיצת כפתור.
מדובר בפריצת דרך של ממש, שמהווה עזרה חשובה ומשמעותית, אשר דוגמא מוחשית לה ניתן לראות בהרצאותיו של פרופ' סטיבן הוקינג זכרו לברכה, האסטרופיזיקאי הידוע והמבריק שסלל את הקריירה המזהירה שלו בצילה של מחלת ה-ALS, הגורמת לשיתוק מלא של שרירי הגוף, לרבות שרירי הדיבור.
מערכות TTS כטכנולוגיה לשיפור השירות והרחבת מעגלי לקוחות של עסקים מתקדמים:
מערכת המאפשרת שליחת הודעות אוטומטית, קביעת תורים באמצעות מענה קולי והקראת חדשות אודות החברה ללקוחותיה, מהווה את סטנדרט השירות המצופה כיום מבתי עסק מתקדמים ועדכניים.
״לא רק שמערכות טקסט לדיבור מגבירות משמעותית את נוכחותו של בית העסק במרחב האינטרנטי״, מציינת עדי, ״הן גם מנגישות אותו לבעלי המוגבלויות וכן ללקוחות שמקיימים אורח חיים של מולטי-טסקינג, ומעוניינים להאזין למסרי החברה והודעותיה תוך עיסוק במשימות אחרות".
זאת ועוד: המרת הטקסט שהוזן לקול ברור ושליחתו ללקוחות קיימים ופוטנציאליים, מהווה דרך מזמינה, קלה להבנה ונגישה שמקדמת מעורבות רבה יותר של הלקוח באמצעות ערוץ הפצה נוסף.
זו דרך נפלאה לבדל את העסק, להציע ערך נוסף ללקוחותיו, לשפר את תדמיתה של החברה כבעלת מודעות מפותחת להנגשת שירותיה לציבור בעלי המוגבלויות ולתרום לשגשוג כלכלי ועסקי.
לסיכום, כיום מערכות הטקסט לדיבור משמשות לא רק את בעלי המוגבלויות ולקויות הראייה, אלא נמצאות בשימוש רחב על ידי מוסדות חינוך, תאגידי תחבורה ציבורית, מרכזי לימוד שפה ומספר גדל והולך של אתרי אינטרנט המייצגים חברות וארגונים שונים.
מטרו (נת"ע)אג"ח למטרו: נת"ע בוחנת גיוס חוב לפרויקט בגוש דן
מי המוסדי שישקיע בפרויקט הכי גדול במדינה אבל גם הכי מסוכן? החברה הממשלתית מקדמת הנפקת אג"ח כדי לגשר על פערי עיתוי בין הוצאות העתק להכנסות עתידיות ממסים ואגרות, אך מתווה המימון עדיין לא הוכרע, והשאלות על סיכונים, לוחות זמנים והרלוונטיות התחבורתית של
הפרויקט מתרבות
פרויקט המטרו יהיה ארוך מהצפוי ויעלה יותר מהצפוי. פרויקט המטרו עלול להגיע לקו הסיום בעוד 20-23 שנים ולהיות לא רלוונטי כי יהיו פתרונות לתחבורה אחרים מהירים ויעילים יותר כי יהיה רובטקסי , אוטובוסים אוטונומיים וכמות הרכבים על הכביש תהיה נמוכה יותר משמעתית כי זה החזון העתידי של עולם הרכבים האוטונומיים. אז למה שמישהו ישקיע באג"ח של המטרו? הסיכון מטורף. הסיבה היחידה היא בגיבוי של המדינה - המדינה הולכת על הפרויקט שעשוי להגיע גם ל-250 מיליארד שקל ויותר והיא צפויה לגבות אותו כלכלית.
נת"ע, החברה הממשלתית שאמורה לבצע את פרויקט המטרו בגוש דן, מקדמת בחודשים האחרונים אפשרות להנפיק אג"ח בבורסת תל אביב. המטרה: לגשר על פער העיתוי בין ההוצאות האדירות הנדרשות להקמת הפרויקט לבין ההכנסות ממסים ואגרות, שחלקן אמורות להגיע רק בעוד שנים רבות - אם בכלל. המהלך ממתין להכרעה של מיכל עבאדי-בויאנג'ו, המועמדת לתפקיד החשבת הכללית, שעדיין לא אושרה בממשלה. השאלה שנשאלת היא מי בדיוק ירצה להשקיע באג"ח של פרויקט שיכול להימשך שנים, בעולם שבו הטכנולוגיה משתנה כל רגע ובקצב שדברים מתקדמים, אנחנו עשויים להיות במרחק שנים מרובוטקסי ברחובות.
מדובר בפרויקט תשתית בקנה מידה חריג, אולי הגדול שידעה ישראל, עם תג מחיר שמתקרב ל־180 מיליארד שקל לאחר הצמדות. אלא שבניגוד לכביש או מחלף, כאן מדובר במיזם רב־שנתי, רב־שלבי ורב־סיכונים, שמעטים יכולים לומר בביטחון מתי יושלם, כמה יעלה בפועל, והאם יעמוד בתחזיות הביקוש המקוריות. הוצאות על תכנון, חפירה וביצוע צפויות להתחיל הרבה לפני שמסים, אגרות גודש והשבחת קרקע יתחילו לזרום. חלק מההכנסות, אם יגיעו, תלויות בהחלטות של יזמים, תזמון מימוש נכסים ומצב שוק הנדל"ן, משתנים שקשה מאוד לבנות עליהם תזרים יציב.
במילים אחרות, מישהו צריך לממן את הפער. האפשרות שמונחת כעת על השולחן היא לגייס את הכסף מהציבור, דרך אג"ח. מדובר בחוב שמגובה בפרויקט שטרם התחיל בפועל, שמועד סיומו אינו ברור, ושכבר כיום מלווה באזהרות חוזרות ונשנות של מבקר המדינה ובנק ישראל. גם אם תינתן ערבות מדינה, כמעט הכרחית במקרה כזה, קשה להתעלם מהעובדה שמדובר בחוב שמגלם סיכון תפעולי, רגולטורי ופוליטי גבוה. כל שינוי במדיניות, כל עיכוב תכנוני, כל משבר תקציבי, עלולים לדחות עוד יותר את היום שבו המטרו יהפוך מרעיון למציאות.
- מבקר המדינה: פרויקט המטרו בגוש דן סובל מעיכובים, מחסור בכוח אדם וחוסר היערכות לאומית
- בעקבות המטרו: רובע חדש לחולון עם 18,000 יח"ד הופקד ונכנס לתכנון
- המלצת המערכת: כל הכותרות 24/7
הפתרון התחבורתי של העתיד?
עולה גם שאלה לגבי עצם ההיגיון התחבורתי
של הפרויקט: האם המטרו, כפי שהוא מתוכנן כיום, אכן מייצג את פתרון הניידות המתאים לעשורים הבאים. שוק התחבורה העולמי מצוי בתקופה של שינוי מואץ, עם התפתחות של טכנולוגיות אוטונומיות, מודלים של תחבורה כשירות, ושירותי שיתוף שמערערים על ההבחנה המסורתית בין תחבורה ציבורית
לפרטית. במקביל, רעיונות כמו הפעלה מסחרית של כלי רכב אוטונומיים, כולל שירותי רובוטקסי שנמצאים כיום בשלבי ניסוי והטמעה ראשוניים, מעלים שאלות לגבי גמישות, קיבולת ועלויות. בניגוד לתשתית מסילתית קבועה, פתרונות מבוססי תוכנה ורכב אוטונומי עשויים להתאים את עצמם מהר
יותר לשינויים בדפוסי הביקוש, בצפיפות ובטכנולוגיה, ולהציב סימן שאלה סביב השקעות עתק בתשתיות קשיחות שמועד מימושן רחוק והיכולת להתאימן מוגבלת.
