Восьмая всероссийская открытая ежегодная конференция
«Современные проблемы дистанционного зондирования Земли из космоса»
Москва, ИКИ РАН, 15-19 ноября 2010 г.
(Физические основы, методы и технологии мониторинга окружающей среды, природных и антропогенных объектов)
VIII.A.191
Применение ансамблей непараметрических алгоритмов кластеризации для обработки многоспектральных спутниковых изображений
Пестунов И.А., Куликова Е.А., Синявский Ю.Н., Смирнов В.В.
Институт вычислительных технологий СО РАН
В настоящее время при решении прикладных задач в области экологии и рационального природопользования часто возникает необходимость кластеризации многоспектральных спутниковых изображений. При этом какие-либо априорные сведения о структуре данных, как правило, отсутствуют. В этих условиях наиболее адекватным является применение непараметрических алгоритмов кластеризации. Однако результаты их выполнения при разных значениях входных параметров могут сильно различаться. Это значительно усложняет процесс настройки алгоритмов для решения конкретной задачи.
Устойчивость решений в задачах кластеризации может быть повышена за счет формирования ансамблей решающих правил следующим образом. Для совместного анализа результатов выполнения алгоритма с различными значениями параметров выполняется попарная кластеризация объектов (для каждой пары объектов определяется, принадлежат они одному и тому же кластеру или нет). После этого строится согласованная матрица различий, на основе которой осуществляется итоговая группировка с помощью стандартного агломеративного метода построения дендрограммы. Применение ансамблей позволяет улучшить качество выделяемых кластеров, не увеличивая раздробленность итоговой картосхемы.
Описанная методика применялась для построения ансамблей на основе разработанного авторами непараметрического сеточного алгоритма CCA, который использует гистограммную оценку плотности распределения. Формирование ансамбля на последовательности фиксированных сеток с разным шагом позволило существенно повысить качество выделения границ кластеров без увеличения раздробленности результирующей картосхемы, а также выделить многомодовые кластеры сложных форм.
Другой вариант ансамбля строился на основе разработанного авторами алгоритма MeanSC, опирающегося на непараметрические оценки плотности Розенблатта – Парзена. Этот алгоритм позволяет получать картосхемы более высокой детализации, чем CCA, но является более трудоемким. Построение ансамбля на последовательности решающих правил с различными значениями параметра сглаживания позволило существенно снизить раздробленность результирующей картосхемы.
В дополнение к этому, использование ансамблей значительно упростило настройку параметров алгоритмов.
Указанные ансамблевые алгоритмы применялись для обработки многоспектральных изображений, полученных со спутников LandSat и ALOS с целью выделения типов лесной растительности. В докладе приводятся результаты сравнения построенных картосхем с картосхемами, полученными в ходе визуально-инструментального дешифрирования.
Работа выполнена при частичной финансовой поддержке РФФИ (грант № 09-07-12087-офи_м) и Сибирского отделения РАН (междисциплинарный интеграционный проект № 50).
Методы и алгоритмы обработки спутниковых данных
43