Метод минимизации продолжительности наблюдений и математические модели экстраполяции при малых объемах данных
Ключевые слова:
математические модели экстраполяции, синтезация данных, временные ряды, искусственная нейронная сеть, логнормальное распределение, микробный топливный элемент, биохимическое потребление кислорода.Аннотация
Введение: экстраполяция значений временных рядов с малым объемом данных – задача актуальная, особенно в областях, где требуется быстрое принятие решений на основе ограниченной информации. Одной из ключевых проблем является нахождение наименьшего отрезка исторических данных, достаточного для построения точного прогноза последующих значений временного ряда. Цель: разработать метод минимизации временных наблюдений, позволяющий осуществлять экстраполяцию будущих значений с заранее заданной точностью, и метод синтезации данных на основе параметров математической модели прогнозирования. Результаты: во-первых, разработан метод определения минимальных отрезков эффективного прогнозирования. Метод предполагает наличие обучающей выборки и основан на анализе динамики изменения значений временных рядов вокруг их максимума, что позволило автоматически определять отрезки данных минимальной длины, необходимые для построения прогнозов с заранее заданной точностью. Во-вторых, разработан метод формирования синтетических данных, использующий варьирование параметров математической модели. Синтез данных позволил повысить эффективность обучения искусственных нейронных сетей. Указанные методы были применены в анализе временных рядов напряжения микробных топливных элементов для оценки параметра загрязнения сточных вод — биохимического потребления кислорода. В результате удалось сократить время прогнозирования данного параметра с пяти суток до 12,68 часа с относительной погрешностью 8,1 %. Практическая значимость: предложенные методы, используемые в ходе экологического мониторинга, позволяют оперативно оценивать загрязнение воды и оптимизировать процессы очистки сточных вод.