Обработка информационных последовательностей с использованием адаптивного анализа сегментов при оценке состояния систем
Ключевые слова:
машинное обучение, адаптивные модели, повышение качества обработки, адаптивная обработка сегментов последовательностейАннотация
Введение: формирование и разметка выборок является трудоемкой процедурой, играющей важную роль в процессах обучения с учителем и настройки большого количества моделей машинного обучения. При решении задач с применением методов искусственного интеллекта достаточно часто возникает необходимость снизить затраты на маркировку данных. Цель: повысить качество обработки информационных последовательностей за счет формирования, анализа и определения сегментов последовательностей данных, на которых заранее заданными алгоритмами машинного обучения достигаются лучшие показатели качества. Результаты: предложен метод формирования сегментов информационной последовательности на основе анализа показателей качества моделей обработки, отличающийся от известных, осуществляющих настройку моделей машинного обучения на обрабатываемые данные, разделением последовательности на сегменты и выбора способа сегментирования таким образом, чтобы свойства полученных в сегменте данных лучшим образом соответствовали модели обработки. В отличие от классического подхода, когда модель настраивается на данные, в предлагаемом методе сегментированием последовательности данные настраиваются под модель. Практическая значимость: результаты могут быть использованы в моделях и методах, решающих задачи классификации и прогнозирования. Предложенный метод позволяет частично преодолевать ряд проблемных вопросов, связанных с маркировкой выборок данных. В результате становится возможным обучать модели, используя выборки, которые имеют частичные или неточные метки, а также снизить затраты на процесс разметки. Дальнейшее развитие предложенного решения возможно на основе ансамблевых методов.