Двадцать третья международная конференция "СОВРЕМЕННЫЕ ПРОБЛЕМЫ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ ИЗ КОСМОСА"
XXIII.A.59
Особенности применения нейросетевых моделей различных типов в задачах распознавания антропогенных объектов на космических изображениях
Жуков Д.В. (1), Спесивцева К.А. (1), Харжевский Е.В. (1)
(1) Военно-космическая академия имени А.Ф. Можайского, Санкт-Петербург, Россия
В настоящее время одним из основных инструментов повышения автоматизации процесса дешифрирования космических изображений (КИ) является применение в алгоритмах тематической обработки материалов съемки сверточных нейронных сетей (СНС). Вместе с тем, высокие темпы развития нейросетевых технологий обуславливают появление в сравнительно небольшие промежутки времени все более новых архитектур СНС. При этом, одной из основных проблем алгоритмов, основанных на принципах глубокого машинного обучения, остается сложность прогнозирования результативности распознавания объектов интереса. Таким образом, многообразие различных архитектур СНС с одной стороны, и сложность априорного оценивания показателей качества дешифрирования с другой стороны приводят к проблеме осуществления оптимального выбора модели СНС при решении конкретной задачи дистанционного зондирования Земли. Как правило, такой выбор производится на основе эмпирического опыта с помощью сравнения значений показателей качества обучения, таких как F1-мера, mAP50 и так далее. Однако, анализ результатов таких экспериментов не позволяет сравнивать работу моделей СНС разных типов. Это происходит потому, что у таких сетей отличаются базовые метрики оценки качества обучения. Например, наиболее часто в алгоритмах тематической обработки КИ используются два типа СНС: сегментации экземпляров и семантической сегментации. У сетей сегментации экземпляров основным показателем качества обучения является метрика mAP50, а у СНС семантической сегментации – IoU. Эти метрики имеют принципиально разные алгоритмы расчета. mAP50 учитывает количество правильно и ошибочно распознанных объектов, а также степень уверенности сети отнесения обнаруженного объекта к данному классу. В результате работы СНС семантической сегментации получается набор выходных данных, не позволяющий рассчитать метрику mAP, поэтому основным показателем качества ее работы является отношение площади пересечения областей истинного и предсказанного расположения объектов интереса к площади их объединения.
На данный момент существуют исследования, которые приблизились к решению обозначенной проблемы, однако полноценное сравнение работы СНС различных типов возможно только с помощью экспертной оценки при визуальном анализе результатов распознавания. В Военно-космической академии была проведена такая работа при решении задачи распознавания антропогенных объектов (АО) на КИ. Все выбранные для эксперимента объекты характеризовались следующими параметрами, определяемыми качественными критериями: степень вариативности определения границ объекта (высокая, низкая), линейные размеры объектов (сравнительно большие, маленькие), устойчивость геометрической формы объектов (устойчивая форма, отсутствие устойчивой формы).
Проведенные исследования позволили сделать следующие основные выводы:
АО с низкой вариативностью определения границ, сравнительно небольшие и имеющие устойчивую форму наиболее эффективно распознаются с помощью НС сегментации экземпляров,
АО с низкой вариативностью определения границ, сравнительно небольшие, не имеющие устойчивой формы, одинаково эффективно распознаются как с помощью НС сегментации экземпляров, так и с помощью НС семантической сегментации,
АО с высокой вариативностью границ, любых размеров, не имеющие устойчивой формы, наиболее эффективно распознаются с помощью НС семантической сегментации.
Также были выявлены АО, которые имеют значительную вариативность конструкций, в следствие чего, такому классу объектов нельзя присвоить определенные значения качественных характеристик. При их распознавании наиболее результативным будет совместное использование сетей двух рассматриваемых типов: сегментации экземпляров и семантической сегментации, так как они дополняют друг друга. В этом случае результаты распознавания СНС совмещаются и впоследствии осуществляется фильтрация сегментов по геометрическим и структурным признакам.
При распознавании АО с помощью СНС были отмечены типовые ошибки, характерные для каждого рассматриваемого типа сети в отдельности. Для СНС семантической сегментации такими ошибками являются: некорректное определение границ АО с четкими границами, слияние двух близко расположенных АО в один сегмент, разделение одного АО на разные сегменты, принадлежащие разным классам.
СНС сегментации экземпляров имеют следующие типовые ошибки: некорректное определение границ больших по площади АО с нечеткими границами, ошибочное определение нескольких объектов вместо одного фактически присутствующего на КИ для больших по площади АО, пропуск АО с нечеткими границами.
Представленные результаты позволяют сделать вывод о том, что выбор модели СНС для реализации алгоритма тематической обработки КИ должен производиться в два этапа. На первом этапе необходимо определить наиболее подходящий для решения тематической задачи тип СНС: семантической сегментации или сегментации экземпляров. На втором этапе выбирается архитектура СНС из вариантов, относящихся к выбранному типу.
Второй этап выбора модели осуществляется с помощью анализа метрик оценки качества обучения, в то время как представленная работа позволяет на основе анализа эмпирического опыта и с учетом геометрических и структурных характеристик объектов интереса осуществить первый этап выбора модели сети. Актуальность работы заключается в том, что на сегодняшний день отсутствует полноценный механизм сравнения результативности работы СНС различных типов. Приведенные материалы позволяют частично решить эту проблему применительно к задаче распознавания АО на КИ.
Ключевые слова: Сверточные нейронные сети, машинное обучение, дешифрирование космических изображений
Методы и алгоритмы обработки спутниковых данных