O syntezatorach mowy

Oprogramowanie odczytujące tekst z ekranu komputera, czyli kilka słów o syntezie mowy.

W dzisiejszych czasach prawie każdy posiada sprzęt komputerowy (laptopa, tablet, smart phona itp.) i korzysta z niego w domu, szkole, pracy. Można powiedzieć, że są to urządzenia niezbędne, pomagające w komunikacji, poszerzaniu wiedzy oraz zapewniające rozrywkę. Jest jednak grupa osób, dla których poruszanie się w świecie komputerów oraz Internetu może stanowić problem. Są to osoby niewidome czy słabo widzące, ale również osoby z innymi niepełnosprawnościami, np. problemami w komunikacji. Właśnie dla nich przeznaczone są syntezatory mowy oraz specjalistyczne oprogramowanie pozwalające na odczytywanie tekstu z ekranu komputera.

Synteza mowy i syntezator – co to takiego?

Synteza mowy to proces zamiany tekstu na dźwięk (mowę). Taki proces generowania mowy na podstawie tekstu skopiowanego zazwyczaj do schowka systemowego jest nazywany również TTS czyli „text-to-speech” – „tekst na mowę”. Synteza mowy to specjalne oprogramowanie komputerowe zwane syntezatorem mowy lub głosem.

Speech to goAby syntezator mógł działać właściwie potrzebne jest również specjalny program, z którym będzie on współpracował.

Dla osób niewidomych (w tym słabowidzących) stworzono tak zwany screen reader czyli program udźwiękawiający, np. Supernova Access Suite. Programy udźwiękawiające współpracujące z różnymi syntezatorami mowy pozwalają na odczytywanie na głos tekstów znajdujących się na ekranie komputera, czytanie dokumentów, poczty elektronicznej, napisów w filmach, ebooków. Dla osób wymagających rozszerzonej i alternatywnej komunikacji stworzono również specjalne oprogramowanie komunikacyjne, np. The Grid.

Dla zwykłych użytkowników komputerów również istnieją specjalne programy, wykonujące szereg zadań, jak np. czytanie podpisów pod filmami – AllPlayer, zamianę tekstu na pliki audio – Speech2Go.

Głosy Ivona – przykład syntezatora mowy

Głosy IVONANajbardziej znanym i cenionym na rynku polskim syntezatorem mowy jest Ivona. Głosy Ivona dostępne są dla wielu języków świata, z głosami męskimi i żeńskimi. Przykłady głosów to: Maja, Agnieszka, Jacek, Ewa, Anny, Braian, Marlene i wiele innych. Wybór głosów jest nieustannie poszerzany. Syntezatory Ivona posiadają studyjną jakość głosu i odznaczają się wysoką jakością, dużą dokładnością i precyzją wymowy oraz naturalnym, ludzkim brzmieniem. Potrafią akcentować wyrazy kończące zdanie, zdania pytające oraz wykrzyknikowe, dzięki czemu intonacja syntezy jest poprawna i naturalna. Dzięki syntezatorom można czytać tekst płynnie, literować, robić pauzy. Dla głosów Ivona można również ustawić tzw. Słowniki wyjątków, czyli zmienić sposób czytania słowa lub frazy, przez co wyrazy obcojęzyczne lub odczytywane błędnie będą czytane właściwie. Poprzez wykorzystanie algorytmu sztucznej inteligencji głos Ivona analizuje podany tekst i wypowiada go z odzwierciedleniem wielu cech ludzkiego głosu oraz z naturalną ekspresją. Poza tym każdy syntezator można również zwolnić, przyspieszyć, zwiększyć głośność lub ściszyć, dzięki czemu możliwe jest dostosowanie parametrów mowy do indywidualnych potrzeb użytkownika.

Mowa syntetyczna Nuance Vocalizer Expressive (teraz znane jako Cerence TTS)

Głosy Nuance Nuance Vocalizer Expressive (nowa nazwa to Cerence TTS) to synteza mowy z rozszerzoną ekspresywnością, dzięki czemu uzyskujemy naturalniejszą mowę w wielu zastosowaniach.

Naturalnie brzmiący głos: dzięki łączeniu mowy syntetycznej z zarejestrowaną mową naturalną oraz predefiniowanymi i dopracowanymi segmentami efektem jest miła dla ucha wypowiedź, a nie sztuczny syntezator..

Globalny zasięg: szeroki wachlarz ponad 50 języków głosów Nuance w ponad stu głosach daje globalny zasięg tej technologii.

Wielorakie zastosowania: Vocalizer Expressive wzbogaca odbiór bardzo wielu aplikacji od branży samochodowej i elektroniki użytkowej do technologii wspomagającej osoby niepełnosprawne.

Przyszłość głosów syntetycznych jako innowacyjnego narzędzia

Oczywiście mimo wielu ulepszeń technologicznych nie zawsze syntezator mowy czyta wszystko poprawnie i czasem brzmi sztucznie. Jednak nie ulega wątpliwości, że mowa generowana przez syntezatory stanowi ułatwienie dla osób, szczególnie z różnymi niepełnosprawnościami, poprawiając komfort korzystania z wielu aplikacji i urządzeń. Synteza mowy i poszczególne głosy Ivona będą nieustannie rozwijane, wprowadzane będą nowe rozwiązania technologiczne, można więc przypuszczać, że w wyniku tego syntezatory mowy będą miały coraz szersze spektrum zastosowania, ułatwiając funkcjonowanie osób z dysfunkcją narządu wzroku. jak i również z innymi potrzebami, ale także będą miały zastosowanie w wielu dziedzinach życia, w systemach komunikacji i usługach.


Web design: aweo.pl