Речевите синтезатори или TTS са компютърно генерирани гласове, които могат да изговарят подаден към тях текст. Неговият източник би могъл да е екранен четец, софтуер за електронни книги като Balabolka или друга програма.
През последните години технологиите за създаване на речеви синтезатори претърпяха значително развитие. В резултат на това се появяват все по-естествено звучащи гласове.
Към момента най-широко използван е SpeechLab 2.0 с гласа на актрисата Гергана Стоянова, разработен от Българската асоциация за компютърна лингвистика преди малко повече от 15 години. Синтезаторът е наличен за Windows и Android. Все още той е доста трудно заменим откъм качество на говора, въпреки че бяха създадени някои алтернативи като Daria от пакета Vocalizer TTS, Irina на Innoetics и българския глас за eSpeak.
В този материал ще си поговорим за още два речеви синтезатора, които се появиха през последните месеци. Те са разработени чрез съвременна невронна технология с елементи на изкуствен интелект.
Microsoft Neural TTS
Това са висококачествени гласове, които много наподобяват естествената човешка реч. Поддържат се 60 езика, включително и български. Вариантите са мъжки и женски, а имената им са Калина и Борислав. Могат да бъдат изпробвани от страницата Text to Speech в сайта на платформата за облачни услуги Microsoft Azure. За целта направете следното:
- Изтрийте примерния текст от полето и въведете това, което искате да бъде прочетено.
- От меню „Language“ изберете „Bulgarian“.
- Във „Voice“ задайте „Kalina“ или „Borislav“. Гласът Microsoft Ivan, който значително отстъпва по качество, също може да бъде изпробван.
- Имате възможност да промените скоростта („Speaking speed“) и височината („Pitch“). Новите стойности обаче няма да бъдат отразени по време на говоренето.
- Натиснете „Play“ и текстът ще бъде прочетен според избраните настройки.
Гласовете звучат наистина качествено и доста приятно, а задаването на висока скорост не води до изяждане на букви и сдъвкване на думи, което се наблюдава например при Vocalizer Daria. Калина и Борислав имат някои проблеми с ударенията и не се справят чак толкова добре с английския, но за четене на текстове на български определено биха били полезни.
Не е ясно кога и дали от Microsoft ще позволят Neural TTS да бъде използван в Windows. Към момента гласовете са налични за разработчици на приложения чрез платформата за облачни услуги Microsoft Azure.
Женският вариант Калина може да бъде изпробван и в сайта bntnews.bg, където има вградена възможност за прочитане на всяка новина чрез него. За целта е необходимо да влезете в дадена публикация и да намерите прозорчето на функцията. Можете да я стартирате чрез бутона „Play“. Тази възможност присъства и в приложението BNT News за Android и iOS.
Гласовете Калина и Борислав са налични и в мобилния вариант на Microsoft Word за Android. Имайте предвид обаче, че функцията не е съвместима с екранния четец TalkBack и не може да се стартира, докато той е включен. Microsoft Word за iOS все още не е преведен на български, затова там възможността не е достъпна. За да използвате гласовете в Android, направете следното:
- Изтеглете мобилната версия на Word от Google Play магазина.
- Отворете приложението и се впишете с вашия Microsoft акаунт.
- Създайте нов документ.
- В него поставете текста, който искате да бъде прочетен.
- Отворете менюто в горната дясна част на дисплея.
- Изберете опцията „Прочети на глас“. За да започне изговарянето, необходимо е преди това да сте изключили екранния четец TalkBack, ако го използвате.
- От появилото се прозорче можете да се придвижвате напред и назад в текста, както и да настройвате параметрите на гласа.
SkyCode TTS
Този речев синтезатор е разработен от компанията SkyCode, която още преди години беше известна със софтуера за машинен превод WebTrance. Вариантите са мъжки и женски, а имената им са Владо и Виолета. Могат да бъдат изпробвани чрез сайта tts.skycode.com.
Гласовете звучат доста естествено, но имат проблем с някои ударения, както и с четенето на текстове на английски. Справедливо е обаче да отбележим, че синтезаторът е в начален етап на разработка.
Налична е версия за Android на цена от 8,99 лв. Този вариант често получава обновления и си личи, че разработчиците полагат немалко усилия за изчистване на бъговете. В резултат производителността на гласовете се подобрява доста бързо и най-вероятно не е далеч моментът, когато ще могат да бъдат използвани като основни.
Ако имате желание, бихте могли да закупите приложението за Android. Така ще спонсорирате проекта и ще повишите вероятността той да бъде развиван със същото старание, както до момента. Вашите мнения и препоръки можете да изпращате на имейл guser@skycode.com.
Ако използвате мобилното приложение, за да смените варианта на гласа е необходимо да влезете в настройките за синтезиран говор на вашето устройство, след това в опцията за език. От там бихте могли да изберете мъжкия вариант (Владо) или женския (Виолета).
Очаквайте още интересни материали тук, както и на страницата ни във Facebook. Можете да разгледате и продуктите в нашия електронен магазин.