Двадцать третья международная конференция "СОВРЕМЕННЫЕ ПРОБЛЕМЫ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ ИЗ КОСМОСА"
XXIII.B.508
Анализ риска лесных пожаров на основе данных ДЗЗ и гибридных методов машинного обучения
Николайчук О.А. (1)
(1) Институт динамики систем и теории управления им. В.М. Матросова, Иркутск, Россия
Задача прогнозирования риска лесных пожаров имеет высокую значимость вследствие масштабного ущерба, исчисляемого сотнями тысяч гектаров, бюджетных затрат на противопожарные мероприятия и необходимости рационального планирования природоохранных мероприятий. Использование данных дистанционного зондирования Земли (ДЗЗ) позволяет получать сопоставимую и актуальную информацию о состоянии растительности и почвенно-климатических условий, а интеграция этих данных с методами машинного обучения обеспечивает повышение объективности оценки рисков и обеспечивает мониторинг удаленных районов.
Исследование выполнено на примере Иркутской области с использованием данных космического мониторинга Sentinel-2A, исторических пожаров за 21 век, предоставленные ИКИ РАН [4], данных реанализа RDA [7,8], лесных регламентов [3], государственной статистики [2], пространственных данных геоинформационных систем [1,5,6]. Подготовка выборок включала формирование событий «пожар» и «отсутствие пожара», пространственно-временную агрегацию и интеграцию географических факторов: топографических, климатических, социальных и вегетационных. Для выделения значимых факторов применялись методы корреляционного анализа и проверки мультиколлинеарности.
Для верификации данных о лесных пожарах реализована модель оценки площадей возгораний на основе Random Forest и набора вегетационных индексов, характеризующих степень выгорания и восстановление растительности. Точность распознавания предложенной модели на валидационной выборке для территории Киренского района за 2019 год составила 0.975 по метрике Accuracy, F1-score – 0.962.
Модели прогнозирования риска лесных пожаров на всю территорию исследования разработаны на основе методов машинного обучения Case-based reasoning (CBR), Random Forest (RF). С использованием метода автоматического машинного обучения AutoML (AutoGluon) реализованы модели для отдельных четырех кластеров лесничеств, полученных на основе метода K-means, с учетом схожести влияния географических факторов на возникновение пожаров.
Гибридная модель объединяет алгоритмы RF, CBR и AutoML, обеспечивая тем самым адаптацию модели к особенностям различных кластеров территорий. Для первого кластера территорий результат классификации формируется медианным голосованием трех бинарных моделей. Для кластеров № 2 и № 4 используется модель Random Forest, для кластера № 3 – AutoML. Такое распределение моделей основано на сравнении их эффективности по метрикам F1-score и Accuracy. Реализованная стратегия позволила адаптировать модель к различным географическим условиям и уменьшить долю ошибочных прогнозов.
Точность предложенной гибридной модели произведена на тестовых данных за различные периоды: 2008, 2016 и 2024 г. и составила F1-score – 0.894, Accuracy –0.892 , что превышает показатели базовых моделей и аналогичных решений.
Гибридная модель интегрирована в автоматизированную информационную систему прогнозирования риска лесных пожаров, обеспечивающую сбор, верификацию и визуализацию данных. Разработанное решение позволяет оперативно оценивать уровень пожарной опасности и может быть масштабировано для территорий с аналогичными природно-климатическими характеристиками.
Работа выполнена в рамках гранта № 075-15-2024-533 Министерства науки и высшего образования РФ на выполнение крупного научного проекта по приоритетным направлениям научно-технологического развития (проект «Фундаментальные исследования Байкальской природной территории на основе системы взаимосвязанных базовых методов, моделей, нейронных сетей и цифровой платформы экологического мониторинга окружающей среды»).
Ключевые слова: ДЗЗ, прогнозирование риска лесных пожаров, методы машинного обучения, Random Forest, CBR, AutoML, Иркутская область
Литература:
- Институт географии СО РАН [Электронный ресурс]. http://www.irigs.irk.ru/ (дата обращения: 13.05.2025).
- Иркутскстат. Территориальный орган Федеральной службы государственной статистики по Иркутской области. Население [Электронный ресурс]. https://38.rosstat.gov.ru/folder/167937 (дата обращения: 02.04.2023).
- ЛВПЦ. Леса высокой природоохранной ценности России. ЛВПЦ Иркутской области [Электронный ресурс]. https://hcvf.ru/ru/maps/hcvf-irkutsk (дата обращения: 30 марта 2025).
- Лупян Е.А., Лозин Д.В., Барталев С.А., Балашов И.В., Стыценко Ф.В. Оценка повреждений российских лесов пожарами в XXI веке на основе анализа интенсивности горения по данным прибора MODIS // Современные проблемы дистанционного зондирования Земли из космоса. 2024. Т. 21, № 6. С. 233–249.
- Bychkov I.V., Ruzhnikov G.M., Fedorov R.K., Popova A.K., Avramenko Y.V. On classification of Sentinel-2 satellite images by a neural network ResNet-50 // Computer Optics. 2023. Vol. 47, No. 3. P. 474–481.
- Fick S.E., Hijmans R.J. WorldClim 2: new 1km spatial resolution climate surfaces for global land areas // International Journal of Climatology. 2017. Vol. 37, No. 12. P. 4302–4315.
- Saha S., Moorthi S., Pan H., Wu X., Wang J., Nadiga S., Tripp P., Kistler R., Woollen J., Behringer D. et al.* The NCEP Climate Forecast System Reanalysis // Bulletin of the American Meteorological Society. 2010. Vol. 91, No. 8. P. 1015–1058.
- Saha S., Moorthi S., Wu X., Wang J., Nadiga S., Tripp P., Behringer D., Hou Y.-T., Chuang H., Iredell M. et al.* The NCEP climate forecast system version 2 // Journal of Climate. 2014. Vol. 27, No. 6. P. 2185–2208.
Технологии и методы использования спутниковых данных в системах мониторинга