Кластеризация авторегрессионных моделей речевых сигналов по критерию минимума информационного рассогласования Кульбака — Лейблера
Ключевые слова:
автоматическое распознавание речи, авторегрессионная модель, информационное рассогласование, центроид, кластерАннотация
Решается задача кластеризации множества авторегрессионных моделей речевых сигналов в рамках теоретико-информационного подхода. Для этого был разработан алгоритм нахождения оптимальных параметров авторегрессионной модели в смысле минимума информационного рассогласования Кульбака — Лейблера. На его основе проведена модификация известного алгоритма кластеризации k-средних. Экспериментально исследована эффективность применения
разработанных алгоритмов при дикторонезависимом распознавании изолированных слов с использованием аппарата скрытых марковских моделей с дискретным распределением вероятностей наблюдений. Установлено, что наилучшие результаты по точности распознавания достигаются при использовании коэффициентов линейного предсказания с неравномерным частотным разрешением в качестве вектора признаков и размере кодовой книги векторного квантователя, равном 256.