Войти на сайт
МЕЖДУНАРОДНЫЕ ЕЖЕГОДНЫЕ КОНФЕРЕНЦИИ
"СОВРЕМЕННЫЕ ПРОБЛЕМЫ ДИСТАНЦИОННОГО
ЗОНДИРОВАНИЯ ЗЕМЛИ ИЗ КОСМОСА"
(Физические основы, методы и технологии мониторинга окружающей среды, природных и антропогенных объектов)

Двадцать третья международная конференция "СОВРЕМЕННЫЕ ПРОБЛЕМЫ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ ИЗ КОСМОСА"

XXIII.A.383

Создание масок объектов по данным мультиспектральной космической съёмки для обучения нейросетевых моделей при ограниченном составе исходных данных

Григорьева О.В. (1), Мочалов В.Ф. (1)
(1) Военно-космическая академия имени А.Ф. Можайского, Санкт-Петербург, Россия
Авторами рассматривается задача сегментации материалов многоспектральной космической съемки для идентификации топографических элементов ландшафта, обладающих известным семантическим описанием. В настоящее время для сегментации изображений активно развиваются алгоритмы глубокого машинного обучения, включая искусственные нейронные сети. Однако основной проблемой реализации методов сегментации с помощью искусственных нейронных сетей является создание маски объектов на изображении, содержащей их контуры. Если для инфраструктурных объектов задача разметки может быть решена вручную или с помощью автоматизированных алгоритмов, например SAM (Segment Anything Model), то для природных элементов ландшафты решение задачи выделения чётких границ контуров природных элементов ландшафта затруднительно. Особенно это касается малоизученных труднодоступных территорий, для которых известны только некоторые закономерности наличия спектральных отражательных характеристиках топографических элементов местности (лесов, болот, полей и т.п.), а также данные отдельных полевых обследований, по которым могут быть получены отрывочные обучающие выборки. При таком ограниченном наборе исходных данных сформировать маски затруднительно. Для решения этой проблемы предлагается следующая методика.
На первом этапе для разметки могут быть использованы традиционные подходы обработки изображений, основанные на методах классификации типа SVM (Support Vector Machine), DT (Decision Tree) и т.п., где в качестве признаков используются либо спектрально-яркостные и пространственно-частотные признаки идентификации объектов, либо имеющиеся результаты наземных обследований с семантическим описанием исследуемых элементов ландшафтов. После классификации изображения таким способом получаем предварительную маску, которая может поступать вместе с изображением на вход сети. Однако такие маски не всегда позволяют решить задачу сегментации с требуемым качеством. Причиной этого может являться учёт при обучении только спектральных характеристик об объекте. Если для данных среднего пространственного разрешения это не так важно, то для мультиспектральной съёмки сверхвысокого разрешения приоритет смещается в сторону пространственно-частотных характеристик информации объекта. Примером может служить оценивание проходимости лесной растительности с учетом пространственно-частотных характеристик материалов съёмки. На следующих этапах методики предусмотрено выполнение следующих операций: назначение (может быть случайным) обучающих масок заданного размера (например, 128x128) из общей маски, уточнение контуров объектов, представленных в каждой маске, с использованием алгоритмов нечеткой кластеризации; обоснованный выбор точек наземных обследований для уточнения семантического описания элементов ландшафта в масках. Выбор точек для наземных обследований определяется с учётом степени принадлежности пикселей рассматриваемой маске. В результате осуществляется корректировка масок, поступающих на вход обучения сети.
Рассмотренный подход позволяет уменьшить временные затраты на формирование маски при обучении нейронной сети, а также повысить точность работы алгоритмов машинного обучения за счет уменьшения ошибок, вносимых разметчиком. Методика апробирована при обработке материалов мультиспектральной космической съёмки, выполненной с помощью космических аппаратов Sentinel-2 и Канопус-В, и сегментации элементов ландшафта в пределах сцены на территории Ленинградской области.

Ключевые слова: многоспектральная съемка, методы машинного обучения, идентификация элементов ландшафта, подготовка обучающего набора данных
Литература:
  1. Рашка С. Python и машинное обучение, пер. с англ. А. В. Логунова. М.: ДМК Пресс, 2017. 418 с.
  2. Хасти Тревор, Тибришани Роберт, Фридман Джером Основы статистического обучения. Интеллектуальный анализ данных, логический вывод и прогнозирование Издательство Вильямс, 2020
  3. Maxwell, A.E.; Warner, T.A.; Guillén, L.A. Accuracy Assessment in Convolutional Neural Network-Based Deep Learning Remote Sensing Studies—Part 1: Literature Review. Remote Sens. (2021а), 13, 2450. https://doi.org/10.3390/rs13132450
  4. Maxwell A.E., Warner T.A., Guillén L.A. Accuracy Assessment in Convolutional Neural Network-Based Deep Learning Remote Sensing Studies—Part 2: Recommendations and Best Practices. Remote Sens. (2021б), 13, 2591. https://doi.org/10.3390/rs13132591
  5. Russell G. Congalton and Kass Green. Assessing the accuracy of remotely sensed data: principles and practices 2009 by Taylor & Francis Group, LLC. ISBN 13: 978-1-4200-5512-2.

Методы и алгоритмы обработки спутниковых данных