неделя 15 февруари 2026

БГАСИСТ ООД

Информационен сайт на фирма БГАСИСТ ООД

РъководстваСофтуер

Представяне на добавката Vision Assistant Pro за NVDA

Добавката Vision Assistant Pro за екранния четец NVDA се разработва от скоро. Тя използва езиковия модел Google Gemini, за да анализира и предоставя информация. Необходимо е да имате API Key за Gemini. Можете да прочетете публикацията в блога ни Как да си създадем API Key за Google Gemini.

Щом вече имате такъв, инсталирайте Vision Assistant Pro от магазина за добавки на NVDA, който се намира в менюто на екранния четец, подменю „Инструменти“. За да използвате добавката, е необходимо да въведете своя API Key за Gemini и да зададете някои настройки. За целта направете следното:

  1. Отворете менюто на екранния четец с NVDA+N.
  2. Влезте в „Настройки“, „Опции“.
  3. Със стрелка надолу намерете раздела „Vision Assistant Pro“.
  4. Въведете своя API Key за Gemini в предвиденото за него поле.
  5. Включете опцията „Check for updates on startup“, за да бъдете уведомявани за нови версии на добавката при стартиране на NVDA.
  6. От падащото меню „Target“ изберете „Bulgarian“. Така добавката ще превежда на български от различни езици, когато използвате функциите за превод.
  7. За настройката „AI Response“ също можете да изберете „Bulgarian“, за да получавате отговори на български при анализ на изображения и други запитвания.
  8. Щом направите необходимите настройки, натиснете бутона „OK“, за да се запазят промените.

Vision Assistant Pro има различни функции, които ще разгледаме по-долу. Ето кои са те:

Превод на текст

Добавката може да превежда текст от различни езици. За да чуете превод на текста, върху който сте се фокусирали в момента, натиснете NVDA+Shift+Control+T. Това важи и за маркиран текст.

Ако искате да се преведе съдържанието на клипборда, натиснете NVDA+Shift+Control+Y. Можете да чуете последния превод с NVDA+Shift+Control+L.

Анализ на съдържанието на екрана

Натиснете NVDA+Shift+Control+V, за да чуете описание на елемента, върху който сте фокусирани в момента. Тази функция е особено полезна за изображения в интернет. Когато застанете върху снимка или лого в някой уеб сайт, натиснете NVDA+Shift+Control+V и те ще ви бъдат описани. За да чуете анализ на цялото съдържание на екрана, натиснете NVDA+Shift+Control+O.

Извличане на текст

Vision Assistant Pro може да извършва оптично разпознаване на символи (OCR) за PDF файлове и изображения. Натиснете NVDA+Shift+Control+F и ще се отвори прозорец за избор на файл. След като го изберете, той ще бъде анализиран и в зависимост от неговия обем, след известно време ще се покаже прозорец с резултата.

Добавката има функция за извличане на текст и от аудио файлове. В нейната документация е посочено, че размерът трябва да е до 15 MB. Натиснете NVDA+Shift+Control+A и изберете аудио файл. Vision Assistant Pro може да извлича текст от аудио уроци и песни в MP3, стига записът да е с добро качество и да не е с твърде голяма дължина.

Разпознаване на кодове в картинка

Добавката може да разпознава кодове в картинка, като автоматично се опитва да ги намери в уеб страницата, в която сте фокусирани в момента. Тъй като такива кодове вече се срещат по-рядко, нямам пълноценни впечатления от тази функция.

Клавишната комбинация по подразбиране NVDA+Shift+Control+C не проработи при мен. Затова се наложи да я променя. Ако и при вас не действа, направете следното:

  1. Отворете менюто на екранния четец и влезте в „Настройки“, „Жестове на въвеждане“.
  2. Там намерете раздела „Vision Assistant Pro“ и го разгънете със стрелка надясно.
  3. Направете същото и върху „Attempts to solve a CAPTCHA on the screen or navigator object“.
  4. Изберете клавишната комбинация по подразбиране и я изтрийте с бутона „Премахни“.
  5. Добавете нова например Control+Alt+C чрез бутона за тази цел, задайте да е за всички клавиатурни подредби и натиснете „OK“.

Когато сте в уеб страница с код в картинка, уверете се, че прозорецът е максимизиран, застанете в полето за въвеждане и натиснете зададената по-рано клавишна комбинация. След няколко секунди ще чуете разпознатия код. Имайте предвид, че добавката невинаги успява да извлече текста коректно, така че може да е необходимо да се премине през няколко различни кода в картинка, докато някой от тях се разпознае напълно.

Обобщаване и коригиране на текст

Когато сте се фокусирали върху даден текст в приложение, уеб страница или поле за редактиране, можете да натиснете NVDA+Shift+Control+R. Ще се покаже прозорец със следните опции:

  • „Summarize“ – Обобщава текста.
  • „Fix Grammar“ – Коригира пунктуацията и граматиката.
  • „Fix Grammar & Translate“ – Редактира текста и го превежда на избрания в настройките език.
  • „Explain“ – Обяснява значението.

Когато се покаже прозорец с отговор от изкуствения интелект, можете да задавате допълнителни въпроси към него. Натиснете NVDA+Shift+Control+I, за да чуете текущото състояние на добавката или NVDA+Shift+Control+U, за да проверите дали има нова версия.

Vision Assistant Pro има и други функции като диктуване на текст и анализиране на документи, но не успях да ги накарам да работят коректно. Също така в безплатната версия на Google Gemini изглежда има ограничение за броя заявки, които можете да изпращате чрез вашия API Key за определено време. Възможно е в хода на работата с добавката да се появи следното съобщение за грешка: „Connection Error: Too Many Requests“. Когато това се случи, опитайте отново след няколко часа.

Очаквайте още интересни материали тук, както и на страницата ни във Facebook. Можете да разгледате и продуктите в нашия електронен магазин.

Сподели

Стефан Цвятков

Роден съм в Габрово, но живея в София. Не мисля, че съм толкова пестелив, както е известно за повечето габровци. Харесва ми да чета книги и всякакви текстови материали, както и да слушам музика от различни жанрове. Технологиите са ми страст и се старая да се информирам за непрекъснато променящите се тенденции. Обичам да се ровя в настройки, да изпробвам различни приложения и устройства, като по този начин придобивам нови впечатления. В БГАсист се занимавам с превод на текстове от английски, изготвям и коригирам такива на български, събирам и обработвам информация от Интернет, съдействам при настройването на клиентски компютри и телефони.