Время науки - The Times of Science

Время науки The Times of science 10 №3 Рис. 1. Применение распознавания голоса Процесс идентификации речи представляет сложную многоуровневую систему, в которой происходит анализ и структурирование полученных данных для преобразования в текст. Однако при речевом вводе можно столкнуться с рядом трудностей: от психофизического состояния человека и индивидуальных особенностей речи диктора до высокого уровня шума, помех, эха и качества звукозаписывающей аппаратуры (Рис. 2). Рис. 2. Сложности при распознавании речи Программа автоматического распознавания речи не может содержать шаблон для каждого потенциального пользователя, поэтому сначала её учат «понимать», что говорит конкретный человек. Для этого он несколько раз произносит определенное слово или фразу в микрофон. Программа сохраняет этот пример в виде шаблона, а затем формирует словарь из нескольких сотен слов и коротких фраз. Рассмотрим механизм автоматического распознавания речи подробнее (Рис. 3).