XXII.A.186
Использование методов машинного обучения для определения типов лесов по данным ДЗЗ территории горнопромышленных работ
Орлов С.А. (1), Авершин А.А. (1), Смагин С.И. (1)
(1) Вычислительный центр ДВО РАН, Хабаровск, Россия
Методы машинного обучения широко применяются для решения задач в различных областях: анализ данных, классификация, регрессия, обработка естественного языка, компьютерное зрение и др. Одним из перспективных направлений является обработка спутниковых данных для исследования территорий горнопромышленных работ.
Объекты горной промышленности, такие как отвалы или хвостохранилища, в которых хранятся отходы выработки, часто становятся источником загрязнения окружающей среды. По этой причине требуется проводить мониторинг таких объектов для оценки их влияния на экологию близлежащих территорий.
Одним из наиболее часто применяемых способов оценки влияния объектов горной промышленности на экологию является использование вегетационных индексов, таких как нормализованный вегетационный индекс (NDVI), усовершенствованный вегетационный индекс (EVI) или более точный атмосфероустойчивый вегетационный индекс (ARVI), на который почти не влияют атмосферные факторы. Но для верной оценки состояния прилегающей к исследуемому объекту лесной растительности нужно знать ее тип: хвойный, лиственный или смешанный. Значения вегетационных индексов для различных типов лесов могут сильно отличаться, что приводит к ошибкам определения зоны загрязнения. Поэтому для оценки влияния зоны загрязнения требуется, предварительно, построить карту произрастающих типов лесов на исследуемой территории.
Целью данной работы является автоматическое построение карты произрастающих типов лесов по данным дистанционного зондирования Земли (ДЗЗ) с использованием методов машинного обучения на основе нейронных сетей. В качестве исходных данных использовались спутниковые снимки Sentinel-2 за период ранней зимы/поздней осени и зимний период на территории ДФО, а также данные Global Forest Canopy Height 2019 (данные высоты лесного полога). Проведено сравнение различных комбинаций входных данных (исходных данных и данных, рассчитанных методом Tasseled Cap Transformation) для обучения нейронных сетей U-Net и SegFormer и выбраны оптимальные нейронные сети для определения типов лесов на исследуемой территории: хвойный, лиственный или смешанный.
Лучший результат показали модели, имеющие в качестве входных данных каналы со спутника Sentinel-2 (BLUE, GREEN, RED, NIR, SWIR-1, SWIR-2) и данные высоты лесного полога (Global Forest Canopy Height 2019). Выбранные модели были апробированы на основе данных с территории ДФО.
Результатом проведенного исследования являются три модели нейронной сети U-Net и три модели нейронной сети SegFormer для определения типов лесов, обученные на спутниковых снимках за различные временные периоды: ранняя зима/поздняя осень, лето и два этих периода совместно. Точность определения типов лесов моделями U-Net для этих периодов составила ~78%, ~74% и ~91% соответственно, а леса моделями SegFormer составила ~77%, ~78% и ~81% соответственно.
Для выполнения расчетов были использованы вычислительные ресурсы ЦКП «Центр данных ДВО РАН».
Исследования выполнены при поддержке Российского научного фонда (проект 24-11-20029).
Ключевые слова: машинное обучение, экология, вегетационный индекс, ДЗЗ, Sentinel-2, нейронная сетьПрезентация доклада
Видео доклада
Ссылка для цитирования: Орлов С.А., Авершин А.А., Смагин С.И. Использование методов машинного обучения для определения типов лесов по данным ДЗЗ территории горнопромышленных работ // Материалы 22-й Международной конференции «Современные проблемы дистанционного зондирования Земли из космоса». Москва: ИКИ РАН, 2024. C. 49. DOI 10.21046/22DZZconf-2024aМетоды и алгоритмы обработки спутниковых данных
49