Алгоритм пофонемного распознавания устной речи на основе метода нечеткого фонетического кодирования-декодирова- ния слов
Ключевые слова:
автоматическое распознавание изолированных слов, нечеткие множества, приближенные множества, деревья решений, метод нечеткого фонетического кодирования-декодирования словАннотация
Цель исследования: повышение точности автоматического распознавания русской речи в системах голосового
управления. Методы: предложена модификация метода нечеткого фонетического кодирования-декодирования слов, ис-
пользующая известные признаки согласных звуков, которые классифицируются с помощью алгоритмов машинного об-
учения на основе приближенных множеств и деревьев решений. Приведены наиболее характерные правила классифи-
кации (ЕСЛИ…, ТО …) для каждого типа звука. Результаты: представлены результаты экспериментального исследования
в задаче распознавания голосовых команд для широко используемых в автоматической обработке речи мер близости
(Кульбака — Лейблера, Евклида, Spectral distortion) совместно с популярными признаками речевого сигнала (оценки
спектральных плотностей мощности, коэффициенты линейного предсказания, кепстральные коэффициенты). Показано,
что точность распознавания речи для предложенной модификации на 3—7, 1—7 и 1,5—24 % выше точности известного
аналога — метода фонетического декодирования слов, современной библиотеки CMU Sphinx и популярной системы
Google Voice Search соответственно. Практическая значимость: увеличение степени принадлежности входного сигнала
к эталонному слову за счет предложенного алгоритма классификации согласных звуков приводит к увеличению точности
и к уменьшению количества альтернативных решений на выходе алгоритма распознавания.