PC Magazine/RE logo
©СК Пресс 10/96
PC Magazine, August 1996, p.58

Kurzweil Voice: ваш ПК понимает речь

Дэвид Хаскин


Программа Kurzweil Voice Release 2.0 служит свидетельством того, как далеко продвинулась технологи распознавания речи - и сколько еще предстоит сделать прежде, чем она будет внедрена в широких масштабах. Эта программа преобразует произнесенные слова в текстовый файл, после чего навигация в среде Microsoft Windows становится проще, чем когда-либо. Kurzweil Voice ускоряет вашу работу, но обладает меньшим быстродействием, чем ее конкуренты, и пока далека от совершенства.

После инсталляции этой программы вместе с 30 тыс. известных ей слов и команд (выпускается также вариант программы со словарем на 60 тыс. слов) мы провели сеанс обучения продолжительностью 30 мин, во время которого было продиктовано около 500 слов и чисел, чтобы программа научилась разбираться в особенностях нашего произношения.

Сразу после окончания этого сеанса мы продиктовали документы для последующей обработки, и программа записала их с точностью порядка 90%. Подобного уровн точности достигают и другие аналогичные программные продукты, но такой результат равносилен тому, что в среднем в каждом предложении примерно одно слово "услышано" неверно.

Точность распознавания Kurzweil Voice повышается по мере того, как вы корректируете ее ошибки, и в конце цикла наших испытаний мы обнаружили, что одних и тех же ошибок она обычно не повторяет. Чтобы исправить ошибку, надо сказать "correct this" (исправь это), что приводит к появлению на экране окна с перечнем слов, похожих на неправильно воспринятое. Выберите нужное слово из этого перечня, введите его с клавиатуры или продиктуйте по буквам - словами "альфа, браво" и т.д.

Оказалось, что для максимального повышения точности распознавания между словами надо делать паузу, измеряемую долями секунды. Через четыре часа работы нам удалось добиться достаточной точности при скорости диктовки 65 слов в минуту. Набор текста с клавиатуры, как правило, занимает больше времени, но этот результат на 10 слов в минуту ниже, чем достигнутый нами при работе с программой DragonDictate (PC Magazine, First Looks, May 14, 1996, p.63)

В рассматриваемой нами усовершенствованной версии программы в фирме Kurzweil сочли нужным упростить интерфейс, удалив из него такие необязательные элементы, как окно со списком недавно продиктованных слов. В отличие от других пакетов у Kurzweil Voice нет отдельных режимов для диктовки и управления. Например, просто произнесите команду "file-save" (сохранить файл), и ПК послушно ее выполнит. В отличие от этого в DragonDictate сначала необходима произнести фразу "command mode" (командный режим) и лишь затем сообщить своей программе или Windows, что предпринять.

Kurzweil Voice оказывает пользователям хорошую, помощь в освоении процесса распознавания речи и настройке его точности. Используя великолепно продуманную программу-"мастер" вы сможете разрешить такие типичные проблемы, как, например часто повторяющиеся (постоянные) ошибки распознавания. Некоторым пользователям бывает нелегко точно позиционировать курсор мыши, пользуясь речевыми командами, что осложняет навигацию по экрану, в особенности для людей с физическими недостатками. В DragonDictate для более точного позиционировани указателя мыши экран размечен сеткой.

Хотя программа Kurzweil Voice не оправдывает надежд в тех случаях, когда существенное значение для вас имеет быстродействие, ее все же можно считать хорошим вариантом выбора, поскольку диктовка и управление прикладными программами с ее помощью не доставляют особых хлопот.

Kurzweil Voice Release 2.0
Цена, рекомендуемая изготовителем: 695 долл.
Требуемые ресурсы: 16-Мбайт ОЗУ, 35 Мбайт на жестком диске, звуковая плата, совместимая со стандартом Sound Blaster, ОС Windows 3.1 или Windows 95.
Kurzweil Applied Intelligence Inc., Waltham, MA; 800-380-1234, 617-893-5151;
http://www.kurzweil.com.