Модификация модели YOLO для гибридной системы детекции и трекинга в БПЛА с автоматическим наведением
Ключевые слова:
YOLOv8, depthwise separable convolutions, БПЛА, гибридная детекция, трекинг CSRT, модификация, оптимизация нейросетей.Аннотация
Введение: современные системы компьютерного зрения для БПЛА сталкиваются с проблемой надежной детекции и трекинга в реальном времени при ограниченных ресурсах embedded-платформ, особенно при интеграции нейросетевых детекторов с алгоритмами сопровождения. Существующие реализации YOLO, несмотря на популярность, имеют недостатки: избыточную вычислительную сложность из-за ориентации на многоклассовую детекцию и неоптимальное взаимодействие с трекинг-алгоритмами. Цель: разработать оптимизированную версию YOLOv8 для гибридной системы детекции и трекинга на борту БПЛА с автоматическим наведением, направленную на снижение вычислительной сложности при сохранении точности и адаптацию к ресурсоограниченным платформам. Результаты: исследование основано на экспериментах с модифицированной YOLOv8m, оцененной на embedded-платформе (Raspberry Pi 5) и специализированном датасете ONE_OBJECT. Разработана модифицированная версия YOLOv8m с избирательной заменой стандартных сверточных слоев на depthwise separable convolutions в блоках C3CA и части слоев Neck. В результате экспериментальных исследований достигнуто снижение вычислительной сложности на 32,9 % (с 8,5 до 5,7 GFLOPS), количества параметров на 37,1 % (с 25,9 до 16,3 млн) и требований к памяти на 29,4 % (со 102 до 72 МБ). Скорость обработки на Raspberry Pi 5 увеличилась на 63,6 % (с 11 до 18 FPS) при сохранении высокой точности детекции mAP@0.5 на уровне 93,5 % — падение всего на 0,7 процентного пункта относительно базовой модели при тестировании на датасете ONE_OBJECT. Наибольшее снижение точности (1,2 процентного пункта) наблюдается для объектов малого размера (<50 пикселей). Практическая значимость: разработанная модификация YOLOv8m успешно интегрирована с алгоритмом трекинга CSRT. Следовательно, появляется возможность создавать эффективные гибридные системы автоматического наведения для БПЛА. Предложенное решение особенно перспективно для embedded-систем с ограниченными ресурсами. Более того, полученные результаты открывают новые возможности для создания энергоэффективных систем компьютерного зрения реального времени.