понеделник 7 октомври 2024

БГАСИСТ ООД

Информационен сайт на фирма БГАСИСТ ООД

РъководстваСофтуер

Някои нови речеви синтезатори за български език

Речевите синтезатори или TTS са компютърно генерирани гласове, които могат да изговарят подаден към тях текст. Неговият източник би могъл да е екранен четец, софтуер за електронни книги като Balabolka или друга програма.

През последните години технологиите за създаване на речеви синтезатори претърпяха значително развитие. В резултат на това се появяват все по-естествено звучащи гласове.

Към момента най-широко използван е SpeechLab 2.0 с гласа на актрисата Гергана Стоянова, разработен от Българската асоциация за компютърна лингвистика преди малко повече от 15 години. Синтезаторът е наличен за Windows и Android. Все още той е доста трудно заменим откъм качество на говора, въпреки че бяха създадени някои алтернативи като Daria от пакета Vocalizer TTS, Irina на Innoetics и българския глас за eSpeak.

В този материал ще си поговорим за още два речеви синтезатора, които се появиха през последните месеци. Те са разработени чрез съвременна невронна технология с елементи на изкуствен интелект.

Microsoft Neural TTS

Това са висококачествени гласове, които много наподобяват естествената човешка реч. Поддържат се 60 езика, включително и български. Вариантите са мъжки и женски, а имената им са Калина и Борислав. Могат да бъдат изпробвани от страницата Text to Speech в сайта на платформата за облачни услуги Microsoft Azure. За целта направете следното:

  1. Изтрийте примерния текст от полето и въведете това, което искате да бъде прочетено.
  2. От меню „Language“ изберете „Bulgarian“.
  3. Във „Voice“ задайте „Kalina“ или „Borislav“. Гласът Microsoft Ivan, който значително отстъпва по качество, също може да бъде изпробван.
  4. Имате възможност да промените скоростта („Speaking speed“) и височината („Pitch“). Новите стойности обаче няма да бъдат отразени по време на говоренето.
  5. Натиснете „Play“ и текстът ще бъде прочетен според избраните настройки.

Гласовете звучат наистина качествено и доста приятно, а задаването на висока скорост не води до изяждане на букви и сдъвкване на думи, което се наблюдава например при Vocalizer Daria. Калина и Борислав имат някои проблеми с ударенията и не се справят чак толкова добре с английския, но за четене на текстове на български определено биха били полезни.

Не е ясно кога и дали от Microsoft ще позволят Neural TTS да бъде използван в Windows. Към момента гласовете са налични за разработчици на приложения чрез платформата за облачни услуги Microsoft Azure.

Женският вариант Калина може да бъде изпробван и в сайта bntnews.bg, където има вградена възможност за прочитане на всяка новина чрез него. За целта е необходимо да влезете в дадена публикация и да намерите прозорчето на функцията. Можете да я стартирате чрез бутона „Play“. Тази възможност присъства и в приложението BNT News за Android и iOS.

Гласовете Калина и Борислав са налични и в мобилния вариант на Microsoft Word за Android. Имайте предвид обаче, че функцията не е съвместима с екранния четец TalkBack и не може да се стартира, докато той е включен. Microsoft Word за iOS все още не е преведен на български, затова там възможността не е достъпна. За да използвате гласовете в Android, направете следното:

  1. Изтеглете мобилната версия на Word от Google Play магазина.
  2. Отворете приложението и се впишете с вашия Microsoft акаунт.
  3. Създайте нов документ.
  4. В него поставете текста, който искате да бъде прочетен.
  5. Отворете менюто в горната дясна част на дисплея.
  6. Изберете опцията „Прочети на глас“. За да започне изговарянето, необходимо е преди това да сте изключили екранния четец TalkBack, ако го използвате.
  7. От появилото се прозорче можете да се придвижвате напред и назад в текста, както и да настройвате параметрите на гласа.

SkyCode TTS

Този речев синтезатор е разработен от компанията SkyCode, която още преди години беше известна със софтуера за машинен превод WebTrance. Вариантите са мъжки и женски, а имената им са Владо и Виолета. Могат да бъдат изпробвани чрез сайта tts.skycode.com.

Гласовете звучат доста естествено, но имат проблем с някои ударения, както и с четенето на текстове на английски. Справедливо е обаче да отбележим, че синтезаторът е в начален етап на разработка.

Налична е версия за Android на цена от 8,99 лв. Този вариант често получава обновления и си личи, че разработчиците полагат немалко усилия за изчистване на бъговете. В резултат производителността на гласовете се подобрява доста бързо и най-вероятно не е далеч моментът, когато ще могат да бъдат използвани като основни.

Ако имате желание, бихте могли да закупите приложението за Android. Така ще спонсорирате проекта и ще повишите вероятността той да бъде развиван със същото старание, както до момента. Вашите мнения и препоръки можете да изпращате на имейл guser@skycode.com.

Ако използвате мобилното приложение, за да смените варианта на гласа е необходимо да влезете в настройките за синтезиран говор на вашето устройство, след това в опцията за език. От там бихте могли да изберете мъжкия вариант (Владо) или женския (Виолета).

Очаквайте още интересни материали тук, както и на страницата ни във Facebook. Можете да разгледате и продуктите в нашия електронен магазин.

Сподели

Стефан Цвятков

Роден съм в Габрово, но живея в София. Не мисля, че съм толкова пестелив, както е известно за повечето габровци. Харесва ми да чета книги и всякакви текстови материали, както и да слушам музика от различни жанрове. Технологиите са ми страст и се старая да се информирам за непрекъснато променящите се тенденции. Обичам да се ровя в настройки, да изпробвам различни приложения и устройства, като по този начин придобивам нови впечатления. В БГАсист се занимавам с превод на текстове от английски, изготвям и коригирам такива на български, събирам и обработвам информация от Интернет, съдействам при настройването на клиентски компютри и телефони.