Методологические подходы и алгоритмы распознавания и подсчета животных на аэрофотоснимках
Ключевые слова:
распознавание, свёрточные нейронные сети, аэрофотоснимки, северные олени.Аннотация
Введение: сложность процессов распознавания и подсчета объектов на фотоснимке непосредственно связана с изменчивостью сопутствующих факторов: физическим различием объектов одного класса, наличием изображений, сходных с распознаваемыми объектами, неоднородным фоном, изменением условий съемки и положением объектов при получении снимка. В этом смысле сложными являются задачи распознавания людей в скоплениях, животных в природной среде, автомобилей с камер видеонаблюдения, объектов строительства и инфраструктуры на аэрофотоснимках и т. п. Задачи имеют свою специфику факторного пространства, но методические подходы к их решению сходны. Цель: разработка методологий и программных реализаций, решающих задачу распознавания и подсчета объектов с высокой изменчивостью, на примере распознавания северных оленей в природной среде. Методы: сравнение двух подходов распознавания: по признакам на основе бинарной классификации пикселей и по эталонам с использованием сверточных нейронных сетей. Результаты: разработаны методологии и программы для попиксельного распознавания с последующей бинаризацией, кластеризацией изображения и подсчетом числа кластеров и распознавания изображений с использованием сверточной нейронной сети архитектуры Mask R-CNN. При этом сеть первоначально обучается распознаванию животных как класса по массиву изображений MS COCO dataset, затем «доучивается» на массиве аэрофотоснимков стад северных оленей. Анализ результатов показывает, что признаковые методы с попиксельным распознаванием дают хорошие результаты на сравнительно простых изображениях (ошибка распознавания 10–15 %). Наличие на снимке артефактов, близких по характеристикам к изображениям оленей, приводит к значительному росту ошибки. Сверточная нейронная сеть показала более высокую точность, которая на тестовой выборке составила 82 %, причем ложные срабатывания отсутствовали. Практическая значимость: создан программный прототип системы распознавания на основе сверточных нейронных сетей с веб-интерфейсом, а сама программа введена в ограниченную эксплуатацию.