Проектирование адаптивной архитектуры сверточной нейронной сети с использованием глубинных сепарабельных сверток для работы в реальном времени на встраиваемых устройствах

Александр Владимирович Сацюк; Сергей Александрович Радковский; Алексей Игоревич Шеховцов; Светлана Дмитриевна Сонина; Александр Александрович Воробьев

doi:10.31799/1684-8853-2026-3-23-34

Сацюк Александр Владимирович Донецкий институт железнодорожного транспорта https://orcid.org/0009-0006-7228-8279
Радковский Сергей Александрович Донецкий институт железнодорожного транспорта
Шеховцов Алексей Игоревич Донецкий институт железнодорожного транспорта
Сонина Светлана Дмитриевна Донецкий институт железнодорожного транспорта
Воробьев Александр Александрович Донецкий институт железнодорожного транспорта

DOI:

https://doi.org/10.31799/1684-8853-2026-3-23-34

Ключевые слова:

Аннотация

Введение: развертывание современных систем компьютерного зрения на встраиваемых устройствах (например, Raspberry Pi 5) сталкивается с проблемой достижения реального времени (целевой порог 20 FPS) при анализе потока с MIPI-камеры из-за жестких ограничений ресурсов. Базовые однопроходные детекторы, такие как YOLOv8n, обладают избыточной вычислительной сложностью для таких условий. Цель: разработать адаптированную, легковесную архитектуру сверточной нейронной сети путем модификации YOLOv8n, сфокусировав вычислительные ресурсы на объектах среднего и крупного масштаба. Результаты: основное внимание уделено радикальному снижению FLOPs и параметров через замену стандартных сверток на глубинные сепарабельные свертки и исключение избыточных уровней детекции (сокращение выходных голов). Исследование проводилось на платформе Raspberry Pi 5 с входным разрешением 1280×720. Архитектурная реконфигурация привела к созданию модели OptiYOLO с минимальными показателями: 1,98 млн параметров и 4,1 GFLOPs. После квантования до INT8 достигнута частота обработки 28,7 FPS, что значительно превосходит требование реального времени. Общая точность составила 73,4 % (mAP0.5), что признано приемлемым компромиссом. Точность для критических классов («автомобиль» – 86,1 %, «человек» – 82,5 %) подтвердила успешное перераспределение ресурсов на более крупные объекты. Практическая значимость: разработанная OptiYOLO предоставляет сбалансированное решение для автономных, энергоэффективных систем видеонаблюдения, где приоритетом является скорость обработки, а не детекция мелких объектов.

Информационно-управляющие системы

DOI:

Ключевые слова:

Аннотация

Опубликован

Как цитировать

Выпуск

Раздел

Разделы

Мы в сети

Мы в сети