Метаалгоритм управления процессами синтеза моделей машинного обучения
Ключевые слова:
Аннотация
Введение: методы автоматизированного машинного обучения позволяют автоматизировать синтез моделей машинного обучения, адаптированных к обработке конкретных данных. Однако эти методы требуют значительных временных и вычислительных затрат. Цель: разработать метаалгоритм управления процессами синтеза моделей машинного обучения, позволяющий снизить вычислительную сложность автоматического построения моделей машинного обучения. Результаты: предложен общий метаалгоритм управления процессами синтеза моделей машинного обучения и частный алгоритм, предусматривающий ограничение пространства поиска за счет использования метаобучения. Предлагаемый частный алгоритм основан на использовании метасвойств данных и онтологии, содержащей правила выбора алгоритмов машинного обучения в зависимости от метасвойств обрабатываемых данных. Наполнение онтологии выполняется за счет предварительной обработки результатов ранее синтезированных моделей машинного обучения. Для частного алгоритма разработан алгоритм формирования обучающей выборки и алгоритм построения онтологии для сокращения пространства поиска. Проведенные экспериментальные исследования показали, что использование предложенного частного алгоритма позволило снизить время синтеза моделей машинного обучения на 41,12 %. Кроме того, у полученных моделей повысились значения достоверности (+0,54 %), полноты (+0,34 %) и AUC (+1,85 %). Практическая значимость: частный алгоритм, разработанный на основе метаалгоритма, помогает снизить вычислительную сложность процесса автоматического построения моделей машинного обучения, что облегчает применение машинного обучения в предметных областях, требующих оперативного построения и адаптации моделей машинного обучения к новым данным и новым задачам.