Проектирование адаптивной архитектуры сверточной нейронной сети с использованием глубинных сепарабельных сверток для работы в реальном времени на встраиваемых устройствах
Ключевые слова:
Аннотация
Введение: развертывание современных систем компьютерного зрения на встраиваемых устройствах (например, Raspberry Pi 5) сталкивается с проблемой достижения реального времени (целевой порог 20 FPS) при анализе потока с MIPI-камеры из-за жестких ограничений ресурсов. Базовые однопроходные детекторы, такие как YOLOv8n, обладают избыточной вычислительной сложностью для таких условий. Цель: разработать адаптированную, легковесную архитектуру сверточной нейронной сети путем модификации YOLOv8n, сфокусировав вычислительные ресурсы на объектах среднего и крупного масштаба. Результаты: основное внимание уделено радикальному снижению FLOPs и параметров через замену стандартных сверток на глубинные сепарабельные свертки и исключение избыточных уровней детекции (сокращение выходных голов). Исследование проводилось на платформе Raspberry Pi 5 с входным разрешением 1280×720. Архитектурная реконфигурация привела к созданию модели OptiYOLO с минимальными показателями: 1,98 млн параметров и 4,1 GFLOPs. После квантования до INT8 достигнута частота обработки 28,7 FPS, что значительно превосходит требование реального времени. Общая точность составила 73,4 % (mAP0.5), что признано приемлемым компромиссом. Точность для критических классов («автомобиль» – 86,1 %, «человек» – 82,5 %) подтвердила успешное перераспределение ресурсов на более крупные объекты. Практическая значимость: разработанная OptiYOLO предоставляет сбалансированное решение для автономных, энергоэффективных систем видеонаблюдения, где приоритетом является скорость обработки, а не детекция мелких объектов.