מערכת דיבור רון חושקובר
צילום: שאטרסטוק

העתיד כבר כאן! הכירו את טכנולוגיית TTS לזיהוי והפקת דיבור

האם האמנת שאי פעם תוכל לתת למחשב להקריא לך את היצירה הספרותית האהובה עליך?המדע הבדיוני הזה, כבר קיים בשנת 2018! טכנולוגיית TTS מתקדמת בצעדי ענק והיא כאן כדי להישאר!

 

טכנולוגיית TTS הינה מערכת טקסט לזיהוי והפקת דיבור הקולטת אינפוט, מזהה ומנתחת אותו לא רק בכל הנוגע למילים בודדות, אלא עבור משפטים שלמים ואף טקסטים ארוכים ומורכבים.

במאמר זה נבדוק מה המשמעות של המערכת, לאיזה שימושים היא יעילה ומהם הצרכים להם היא מספקת מענה מיטבי.

 

אז מהי מערכת טקסט לדיבור?

מערכת טקסט לזיהוי והפקת דיבור, כשמה כן היא – מערכת ממוחשבת שמסוגלת לפענח ולייצר דיבור אנושי.

במקרה של זיהוי דיבור יהיה קלט, שיגיע ממיקרופון במכשיר שאליו מדבר המשתמש או משיחה טלפונית נכנסת, והמערכת תזהה את התוכן או את זהותו של הדובר.

כך, ישנם ארגונים כמו קופות חולים, המאפשרים ללקוח להזמין תור לפגישה באמצעות מערכת שמפענחת את תכני הדיבור, וכן מוסדות בנקאיים, העושים שימוש בטכנולוגיה לצורך זיהוי הלקוח על פי קולו, במקום הקשת סיסמאות מסורבלת.

בנוסף, נעשה שימוש במערכת כסינטיסייזר שמפיקה ומייצרת באופן מלאכותי דיבור בקול אנושי, שיכלול מתקדם שפותח לראשונה לצרכי הנגשה למען אוכלוסיית לקויי הראייה.

 

איך מערכת לזיהוי והפקת דיבור פועלת?

״ישנן מערכות TTS שונות בשוק״ מציינת עדי כהן, מנהלת בחברת פייקול, ״חלקן מתבססות על שרשור מקטעי דיבור מוקלטים, המאוחסנים  במסדר נתונים ייעודי, בעוד שהדגמים המתקדמים יותר הנם מכשירי סינטיסייזר לכל דבר, אשר מפיקים פלט של דיבור אנושי באמצעות מודלים חדשניים של מערכות קול".

 

מערכת מתקדמת של סינטיסייזר דיבור מורכבת משני מערכים: החזיתי והעורפי.

תפקיד המערך החזיתי הוא לעבד טקסט כתוב וגולמי כך שיהיה מוכן להקראה, על ידי המרת קיצורים, ראשי תיבות, מספרים וסמלים למקבילות כתובות בשפה המבוקשת.

בהמשך לכך, מחלק המערך החזיתי את הטקסט לחלקים תחביריים, כמו חלקי משפט ומשפטים, וליחידות פונטיות. בתום עיבודו של הטקסט, ממיר המערך העורפי את היחידות הפונטיות לצלילים קוליים וברורים, הניתנים להשמעה כפלט המדמה דיבור אנושי.    

 

שימושים רווחים במערכות טקסט לדיבור ויתרונותיהן

״מערכות טקסט לדיבור אמנם הומצאו במקור לרווחתם של ציבור לקויי הראייה״, מציינת עדי, ״אך נמצאות כיום בשימוש רחב בשוק, וחולשות על תחומים מתרבים והולכים של יישומים שחורגים בהרבה מהנגשה לבעלי מוגבלויות בלבד. מוסדות חינוך ואקדמיה, גופי תחבורה ציבורית, אפליקציות ומשחקים בעולם הגיימינג כמו גם חברות וארגונים עסקיים מובילים – כולם משתמשים ומסתמכים על מערכות טקסט לדיבור בטכנולוגיית TTS".

קיראו עוד ב"בארץ"

 

לפניכם שימושים עיקריים ויתרונות משמעותיים שטמונים במערכות טקסט לדיבור כיום: 

 

מערכות TTS  כטכנולוגיה המסייעת לתלמידים ולסטודנטים במוסדות הכשרה וחינוך

מבחנים מהווים, כידוע, גורם ללחץ ולסטרס עבור תלמידי בית ספר וסטודנטים גם יחד, כשלחץ הבחינות מקשה על חלק מהנבחנים לקרוא את ההוראות והשאלות שכלולות במבחן.

מערכת טקסט לדיבור מספקת דרך קלה ויעילה להמרת התוכן לקול, ו'מקריאה' לנבחן את שאלות הבחינה, על מנת למקסם את הישגיו הלימודיים.

יתרון משמעותי טמון בכך עבור ציבור ליקויי למידה המתקשים בקריאה, ואשר מערכת כזו יכולה לסייע להם ממשית במינוף הציונים, תוך אפשור של חוויית למידה מהנה, המשוחררת מתחושות תסכול מעיקות.

 

מערכות TTS כטכנולוגיה לקידום נגישות באינטרנט

בהתאם לחוק נגישות האתרים באינטרנט, שהוחל מחודש אוקטובר בשנת 2017, כל עסק שהכנסותיו השנתיות עולות על מיליון שקלים בשנה, או שאתר האינטרנט שלו הוקם לאחר מועד החלת החוק – מחויב להנגישו לציבור בעלי המוגבלויות.

חוק זה מבוסס על העיקרון לפיו על המרחב האינטרנטי להיות נגיש לכולם, לרבות לקויי למידה וראייה, ובעלי מוגבלויות נוספים כמו חולי פרקינסון.

״חשוב לדעת״, מציינת עדי, ״שבעלי המוגבלויות מהווים כחמישית מכלל אוכלוסיית הגולשים באינטרנט בישראל, מתוכם למעלה מ-23,000 עיוורים, בעוד שברחבי העולם ישנם כ-774מיליון איש המוגדרים כבעלי ליקויי אוריינות ו-285 מיליון עיוורים בקירוב, המהווים קהל יעד משמעותי ופוטנציאלי״.

מערכות הטקסט לדיבור מאפשרות לעיוורים להיחשף לתוכן על ידי הקראתו, ללקויי למידה להבין טוב יותר את המסרים הכלולים באתר האינטרנט, ולבעלי מוגבלויות מוטוריות כמו חולי פרקינסון – להפעיל את האתרים באמצעות קולם במקום בלחיצה על העכבר והמקלדת.

 

מערכות TTS בשירות עולם הגיימינג והבידור

אפליקציות שונות ובראשן 'ווייז' הידועה, לצד משחקי מחשב וגיימינג ואתרים בידוריים, עושים שימוש בטכנולוגיית TTS , לצורך המחשה ושיפור חווייתו של הגיימר או המשתמש.

כולנו כבר התרגלנו לקול האנושי שמנחה אותנו מהמכשיר הנייד מתי לפנות ולאן, עד להכרזה 'הגעת ליעד', ורבים מאתנו נהנים לשוחח עם דמויות בדיוניות בקווסטים ובמשחקי מציאות מדומה, תוך העצמת האשליה שאנו מדברים, לכאורה, עם בני אדם ממשיים.

 

מערכות TTS כטכנולוגיה המשפרת את השירות למשתמשים בתחבורה ציבורית

טכנולוגיית ה-TTS להפקת דיבור מקלה על מסירתן של הודעות לציבור הנוסעים, על מנת שיוכלו להשלים את נסיעתם בבטחה תוך קבלת מלוא המידע החיוני בזמן.

הודעות על איחור במועד הגעת הרכבת, שינוי במסלולו של קוו האוטובוס ואזכוריהם של כללי בטיחות בסיסיים, מושמעים באמצעות מערכת ה- TTS דרך רמקולים מרכזיים בכלי הרכב הציבוריים ובמתחמי התחנות, ומגיעים לציבור הנוסעים בזמן אמת, באופן נהיר וברור.    

 

מערכות TTS ללימודי שפות ולרכישת כישורי אוריינות

אנשים הרוצים ללמוד שפה חדשה או לשפר את כישורי האוריינות שלהם יכולים לעשות זאת בקלות חסרת תקדים.

אחד המרכיבים החשובים ברכישת שפה חדשה, מבוסס על האזנה לצליליה וקליטה של זרימת המשפטים, אופן ההגייה הנכון ונימת הדיבור האופיינית.

מערכות טקסט לדיבור מאפשרות ללומדים שפה חדשה לקלוט אותה במהירות ובאופן מדויק, מבלי להסתמך על שירותיו של מורה אנושי.

בנוסף, מסייעות מערכות TTS לשיפור הדיקציה, בהירות ההתבטאות וכישורי האוריינות בקרב אנשים שנתקלים בקשיים בתחומים אלו, ומעוניינים לשדרג את יכולותיהם באופן עצמאי. 

מערכות TTS ככלי עזר לציבור האילמים

נוסף על הסיוע המשמעותי שמערכות טקסט לדיבור מעניקות לציבור העיוורים, לקויי הלמידה ובעלי המוגבלויות המוטוריות, הם גם באים לעזרתם של ציבור האילמים.

כיום אילמים יכולים להקליד כל מסר שהם רוצים לומר, ולהשמיעו לבני שיחם על ידי לחיצת כפתור.

מדובר בפריצת דרך של ממש, שמהווה עזרה חשובה ומשמעותית, אשר דוגמא מוחשית לה ניתן לראות בהרצאותיו של פרופ' סטיבן הוקינג זכרו לברכה, האסטרופיזיקאי הידוע והמבריק שסלל את הקריירה המזהירה שלו בצילה של מחלת ה-ALS, הגורמת לשיתוק מלא של שרירי הגוף, לרבות שרירי הדיבור. 

 

מערכות TTS כטכנולוגיה לשיפור השירות והרחבת מעגלי לקוחות של עסקים מתקדמים:

מערכת המאפשרת שליחת הודעות אוטומטית, קביעת תורים באמצעות מענה קולי והקראת חדשות אודות החברה ללקוחותיה, מהווה את סטנדרט השירות המצופה כיום מבתי עסק מתקדמים ועדכניים.

״לא רק שמערכות טקסט לדיבור מגבירות משמעותית את נוכחותו של בית העסק במרחב האינטרנטי״, מציינת עדי, ״הן גם מנגישות אותו לבעלי המוגבלויות וכן ללקוחות שמקיימים אורח חיים של מולטי-טסקינג, ומעוניינים להאזין למסרי החברה והודעותיה תוך עיסוק במשימות אחרות".

זאת ועוד: המרת הטקסט שהוזן לקול ברור ושליחתו ללקוחות קיימים ופוטנציאליים, מהווה דרך מזמינה, קלה להבנה ונגישה שמקדמת מעורבות רבה יותר של הלקוח באמצעות ערוץ הפצה נוסף.

זו דרך נפלאה לבדל את העסק, להציע ערך נוסף ללקוחותיו, לשפר את תדמיתה של החברה כבעלת מודעות מפותחת להנגשת שירותיה לציבור בעלי המוגבלויות ולתרום לשגשוג כלכלי ועסקי.  

 

לסיכום, כיום מערכות הטקסט לדיבור משמשות לא רק את בעלי המוגבלויות ולקויות הראייה, אלא נמצאות בשימוש רחב על ידי מוסדות חינוך, תאגידי תחבורה ציבורית, מרכזי לימוד שפה ומספר גדל והולך של אתרי אינטרנט המייצגים חברות וארגונים שונים.

 

הגב לכתבה

השדות המסומנים ב-* הם שדות חובה
שי אהרונוביץ, רשות המסים (עמית אלפונטה)שי אהרונוביץ, רשות המסים (עמית אלפונטה)

רשות המיסים: ״נסיים את 2025 עם יותר מ-100 מיליארד שקל מעל היעד״

בוועידת עיר הנדל״ן באילת הציג שי אהרונוביץ תמונה אופטימית של גביית המסים לשנה, דיבר על העלייה במיסוי נדל״ן, הסביר את כיוון מס הרכוש והתייחס לחובת הדיווח על שכר דירה ולמצב מדרגות המס

ליאור דנקנר |

ועידת מרכז הבנייה הישראלי באילת, שנפתחה אתמול (שלישי), הציג מנהל רשות המסים שי אהרונוביץ נתוני גבייה גבוהים לשנה ואמר כי המדינה צפויה לסיים אותה ברמה משמעותית מעל היעד שנקבע בתחילתה.

אהרונוביץ אמר כי היעד לשנה עמד על גבייה של 460 עד 462 מיליארד שקל, אך עד סוף נובמבר נגבו כבר כ-466 מיליארד שקל. לדבריו, לאחר ניכוי רכיבים טכניים שמתבצעים בדרך כלל לקראת סוף השנה, ההערכה היא שהמדינה תסיים את 2025 עם כ-100.5 מיליארד שקל מעבר ליעד.

הנתונים האלה מתחברים לתמונה הפיסקלית הרחבה שפורסמה בימים האחרונים על ידי החשב הכללי. לפי האומדן המעודכן, הגירעון ב-12 החודשים האחרונים ירד ל-4.5% מהתוצר לעומת 4.9% בסוף אוקטובר, בין היתר בזכות עלייה של יותר מ-15% בהכנסות המדינה ובכ-15.6% בהכנסות ממסים מתחילת השנה. 

הקפיצה בגביית המסים שאהרונוביץ מציג באה לידי ביטוי גם ברמת המאקרו, בצמצום הגירעון - בשביל תמונה יותר מעמיקה על התכווצות הגרעון: הגירעון התכווץ לרמה של 4.5% מהתוצר: הכנסות המדינה זינקו ב-15%


נדלן חלש בחלק מהשוק אבל קפיצה בעסקאות מסחריות

לדברי אהרונוביץ, גם שוק הנדלן תרם לעלייה בהכנסות, אף שבחלק מסגמנטי המגורים נרשמה חולשה. הוא אמר כי בזכות כמה עסקאות מסחריות גדולות צפויה גביית המסים מהענף להגיע השנה לרמה של 18 עד 19 מיליארד שקל, לעומת כ-15 מיליארד שקל בלבד בשנה שעברה. לדבריו, מדובר בעלייה הן במס רכישה והן במס שבח.

שי אהרונוביץ (צלם: גיל מגלד)שי אהרונוביץ (צלם: גיל מגלד)
מסים

"אני ברווחיות של כמעט 30%, בגלל שאני מרוויח ויעיל, אני צריך לשלם יותר מס?"

הגירעון ב-2025 יהיה נמוך ממה שמעריכים, גביית מסים גדולה בדצמבר בעיקר בזכות חוק הרווחים הכלואים - חברות יחלקו דיבידנדים ענקיים; מנהל רשות המסים מעריך גבייה שנתית של 100 מיליארד שקל מעל היעד בתחילת השנה - האם גביית המסים הזו מעידה על שיפור במשק, ועל המלחמה בהון השחור

רן קידר |

מסים הם החלק הכי מרכזי בהכנסות המדינה. זה רוב רובו של המקור התקציבי. מסים אמורים לבטא את מצב הכלכלה. כשהכלכלה חזקה, הרווחים של הפירמות בעלייה, השכר עולה והמסים עולים, וההיפך. בשנה האחרונה יש עלייה חריגה מאוד במסים. אבל אל תטעו, למרות שהיא חשובה, והיא עוזרת לנתונים להיראות טובים מאוד, היא לא בהכרח מבטאת את מצב הכלכלה, היא מזכירה "הכנסות חד פעמיות" בדוחות של חברות - האם להתייחס להכנסות האלו או לא?

שי אהרונוביץ, מנהל רשות המסים מדבר על גבייה שעולה על 100 מיליארד שקל מהיעד המקורי. ב-11 חודשים נקבו 466 מיליארד שקל, וכנראה שבדצמבר תהיה גביית שיא שתביא את הגבייה הכוללת למעל 530 מיליארד שקל מיליארד שקל. הגבייה הזו, וכן הגבייה בסוף שנת 2024 מיוחסת לשני מהלכים של רשות המסים. 

הראשון הוא מיסוי רווחים כלואים. זה עובד כך. רואה החשבון מתקשר לבעלים של חברה קטנה ואומר לו - "תראה, יש חוק חדש, לא כל כך ברור היישום שלו, אבל המשמעות שלו שצריך לשלם מס על רווחים היסטוריים".

אתה רציני?

"כן צריך לשלם מס-קנס של 2% או לחלק אותם. אפשר לחלק בהדרגה 5% בשנה ומשנה הבאה 6% מהיקף הרווחים. המדינה לא רוצה שיחזיקו רווחים אלא שיחלקו כדי לקבל את המס על הדיבידנד". 

כמה מס?

"זה 30%, ויש גם מס יסף של 3% ועל רווחים מסוימים עוד 2%".

המון. אין משהו לעשות?

 "חילקנו בסוף 2024 כדי להימנע מעליית מס יסף, זוכר. פעלנו נכון, אבל עדיין יש רווחים לצרכי מס לפי המבחן של החוק שמחויבים במס. אני לא חושב שכדאי לשלם קנס של 2%, צריך לחלק דיבידנד של 5% מהרווחים".