Автоматическая обработка и статистический анализ новостного текстового корпуса для модели языка системы распознавания русской речи
Ключевые слова:
модель языка, текстовый корпус русского языка, автоматическая обработка текстаАннотация
Описывается процесс автоматической обработки текстового корпуса, собранного из новостных лент ряда интернет-сайтов, для создания вероятностной n-граммной модели разговорного русского языка. Приводится статистический анализ данного корпуса, даются результаты по подсчету частоты появления различных n-грамм слов. Представлен обзор существующих типов статистических моделей языка.
Опубликован
20-08-2010
Как цитировать
Кипяткова, И. С., & Карпов, А. А. (2010). Автоматическая обработка и статистический анализ новостного текстового корпуса для модели языка системы распознавания русской речи. Информационно-управляющие системы, (4), 2-8. извлечено от https://i-us.ru/index.php/ius/article/view/14204
Выпуск
Раздел
Обработка информации и управление