Представяне на добавката Vision Assistant Pro за NVDA
Добавката Vision Assistant Pro за екранния четец NVDA се разработва от скоро. Тя използва езиковия модел Google Gemini, за да анализира и предоставя информация. Необходимо е да имате API Key за Gemini. Можете да прочетете публикацията в блога ни Как да си създадем API Key за Google Gemini.
Щом вече имате такъв, инсталирайте Vision Assistant Pro от магазина за добавки на NVDA, който се намира в менюто на екранния четец, подменю „Инструменти“. За да използвате добавката, е необходимо да въведете своя API Key за Gemini и да зададете някои настройки. За целта направете следното:
- Отворете менюто на екранния четец с NVDA+N.
- Влезте в „Настройки“, „Опции“.
- Със стрелка надолу намерете раздела „Vision Assistant Pro“.
- Въведете своя API Key за Gemini в предвиденото за него поле.
- Включете опцията „Check for updates on startup“, за да бъдете уведомявани за нови версии на добавката при стартиране на NVDA.
- От падащото меню „Target“ изберете „Bulgarian“. Така добавката ще превежда на български от различни езици, когато използвате функциите за превод.
- За настройката „AI Response“ също можете да изберете „Bulgarian“, за да получавате отговори на български при анализ на изображения и други запитвания.
- Щом направите необходимите настройки, натиснете бутона „OK“, за да се запазят промените.
Vision Assistant Pro има различни функции, които ще разгледаме по-долу. Ето кои са те:
Превод на текст
Добавката може да превежда текст от различни езици. За да чуете превод на текста, върху който сте се фокусирали в момента, натиснете NVDA+Shift+Control+T. Това важи и за маркиран текст.
Ако искате да се преведе съдържанието на клипборда, натиснете NVDA+Shift+Control+Y. Можете да чуете последния превод с NVDA+Shift+Control+L.
Анализ на съдържанието на екрана
Натиснете NVDA+Shift+Control+V, за да чуете описание на елемента, върху който сте фокусирани в момента. Тази функция е особено полезна за изображения в интернет. Когато застанете върху снимка или лого в някой уеб сайт, натиснете NVDA+Shift+Control+V и те ще ви бъдат описани. За да чуете анализ на цялото съдържание на екрана, натиснете NVDA+Shift+Control+O.
Извличане на текст
Vision Assistant Pro може да извършва оптично разпознаване на символи (OCR) за PDF файлове и изображения. Натиснете NVDA+Shift+Control+F и ще се отвори прозорец за избор на файл. След като го изберете, той ще бъде анализиран и в зависимост от неговия обем, след известно време ще се покаже прозорец с резултата.
Добавката има функция за извличане на текст и от аудио файлове. В нейната документация е посочено, че размерът трябва да е до 15 MB. Натиснете NVDA+Shift+Control+A и изберете аудио файл. Vision Assistant Pro може да извлича текст от аудио уроци и песни в MP3, стига записът да е с добро качество и да не е с твърде голяма дължина.
Разпознаване на кодове в картинка
Добавката може да разпознава кодове в картинка, като автоматично се опитва да ги намери в уеб страницата, в която сте фокусирани в момента. Тъй като такива кодове вече се срещат по-рядко, нямам пълноценни впечатления от тази функция.
Клавишната комбинация по подразбиране NVDA+Shift+Control+C не проработи при мен. Затова се наложи да я променя. Ако и при вас не действа, направете следното:
- Отворете менюто на екранния четец и влезте в „Настройки“, „Жестове на въвеждане“.
- Там намерете раздела „Vision Assistant Pro“ и го разгънете със стрелка надясно.
- Направете същото и върху „Attempts to solve a CAPTCHA on the screen or navigator object“.
- Изберете клавишната комбинация по подразбиране и я изтрийте с бутона „Премахни“.
- Добавете нова например Control+Alt+C чрез бутона за тази цел, задайте да е за всички клавиатурни подредби и натиснете „OK“.
Когато сте в уеб страница с код в картинка, уверете се, че прозорецът е максимизиран, застанете в полето за въвеждане и натиснете зададената по-рано клавишна комбинация. След няколко секунди ще чуете разпознатия код. Имайте предвид, че добавката невинаги успява да извлече текста коректно, така че може да е необходимо да се премине през няколко различни кода в картинка, докато някой от тях се разпознае напълно.
Обобщаване и коригиране на текст
Когато сте се фокусирали върху даден текст в приложение, уеб страница или поле за редактиране, можете да натиснете NVDA+Shift+Control+R. Ще се покаже прозорец със следните опции:
- „Summarize“ – Обобщава текста.
- „Fix Grammar“ – Коригира пунктуацията и граматиката.
- „Fix Grammar & Translate“ – Редактира текста и го превежда на избрания в настройките език.
- „Explain“ – Обяснява значението.
Когато се покаже прозорец с отговор от изкуствения интелект, можете да задавате допълнителни въпроси към него. Натиснете NVDA+Shift+Control+I, за да чуете текущото състояние на добавката или NVDA+Shift+Control+U, за да проверите дали има нова версия.
Vision Assistant Pro има и други функции като диктуване на текст и анализиране на документи, но не успях да ги накарам да работят коректно. Също така в безплатната версия на Google Gemini изглежда има ограничение за броя заявки, които можете да изпращате чрез вашия API Key за определено време. Възможно е в хода на работата с добавката да се появи следното съобщение за грешка: „Connection Error: Too Many Requests“. Когато това се случи, опитайте отново след няколко часа.
Очаквайте още интересни материали тук, както и на страницата ни във Facebook. Можете да разгледате и продуктите в нашия електронен магазин.
