Двадцать вторая международная конференция "СОВРЕМЕННЫЕ ПРОБЛЕМЫ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ ИЗ КОСМОСА"
XXII.A.389
Методика формирования первичных и уточнённых значений исходных данных
Мочалов В.Ф. (1)
(1) Военно-космическая академия имени А.Ф. Можайского, Санкт-Петербург, Россия
Рассматриваются вопросы формирования исходных данных для алгоритмов машинного обучения, которые предназначены для автоматизированной обработки материалов мультиспектральной космической съёмки. Предлагается методика формирования исходных данных, обеспечивающая обоснованный выбор обучающих и контрольных выборок.
В пределах сцены, представляющей часть условного кадра материалов космической съёмки, решается задача автоматизированной идентификации элементов ландшафта с известными свойствами. Часто такая задача называется задачей семантической сегментацией элементов ландшафта. Глубина семантического описания определяется содержанием практической задачи обработки. При этом одним из основных проблемных вопросов является выбор исходных данных для дальнейшего формирования обучающей и контрольной выборок в пределах фрагмента сцены. Фрагмент сцены, как правило, выбирается оператором и представляет множество элементов ландшафта с известным общим семантическим описанием, но с неизвестными границами.
Целью настоящей работы является представление методики, обеспечивающей автоматизированное формирование первичных и уточненных значений исходных данных в пределах фрагмента сцены.
Для достижения поставленной цели решены следующие задачи, на основе которых реализованы основные операции предлагаемой методики:
- выбор оператором условных границ сцены, на которой планируется решить задачу автоматизированной идентификации элементов ландшафта, а также фрагмента сцены, содержащего только элементы ландшафта с известным семантическим описанием;
- выбор материалов мультиспектральной космической съёмки, вмещающих сцену;
- автоматизированное формирование первичных значений исходных данных в пределах фрагмента сцены в части обучающих и контрольных выборок на основе математического аппарата нечёткой кластеризации (FCM);
- уточнение содержания исходных данных на основе анализа степени принадлежности элементов изображения (пикселей) рассматриваемым кластерам;
- идентификация элементов ландшафта в пределах сцены на основе первичных и уточнённых значений обучающей выборки и одного из алгоритмов машинного обучения;
оценивание качества результатов обработки материалов съёмки на основе первичных и уточненных значений исходных данных, анализ полученных результатов.
Таким образом при реализации предложенной методика обеспечивается обоснованное формирование исходных данных как в части обучающей выборки для алгоритмов машинного обучения, так и в части контрольной выборки для оценивания качества результатов обработки материалов съёмки.
Ключевые слова: Семантическая сегментация, алгоритмы машинного обучения, обучающая выборка, контрольная выборка, математический аппарат нечёткой кластеризации
Презентация доклада
Методы и алгоритмы обработки спутниковых данных