Войти на сайт
МЕЖДУНАРОДНЫЕ ЕЖЕГОДНЫЕ КОНФЕРЕНЦИИ
"СОВРЕМЕННЫЕ ПРОБЛЕМЫ ДИСТАНЦИОННОГО
ЗОНДИРОВАНИЯ ЗЕМЛИ ИЗ КОСМОСА"
(Физические основы, методы и технологии мониторинга окружающей среды, природных и антропогенных объектов)

Двадцать третья международная конференция "СОВРЕМЕННЫЕ ПРОБЛЕМЫ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ ИЗ КОСМОСА"

Участие в XXI Международной научной Школе-конференции молодых ученых по фундаментальным проблемам дистанционного зондирования Земли из космоса Участие в конкурсе молодых ученых 

XXIII.B.508

Анализ риска лесных пожаров на основе данных ДЗЗ и гибридных методов машинного обучения

Николайчук О.А. (1)
(1) Институт динамики систем и теории управления им. В.М. Матросова, Иркутск, Россия
Задача прогнозирования риска лесных пожаров имеет высокую значимость вследствие масштабного ущерба, исчисляемого сотнями тысяч гектаров, бюджетных затрат на противопожарные мероприятия и необходимости рационального планирования природоохранных мероприятий. Использование данных дистанционного зондирования Земли (ДЗЗ) позволяет получать сопоставимую и актуальную информацию о состоянии растительности и почвенно-климатических условий, а интеграция этих данных с методами машинного обучения обеспечивает повышение объективности оценки рисков и обеспечивает мониторинг удаленных районов.
Исследование выполнено на примере Иркутской области с использованием данных космического мониторинга Sentinel-2A, исторических пожаров за 21 век, предоставленные ИКИ РАН [4], данных реанализа RDA [7,8], лесных регламентов [3], государственной статистики [2], пространственных данных геоинформационных систем [1,5,6]. Подготовка выборок включала формирование событий «пожар» и «отсутствие пожара», пространственно-временную агрегацию и интеграцию географических факторов: топографических, климатических, социальных и вегетационных. Для выделения значимых факторов применялись методы корреляционного анализа и проверки мультиколлинеарности.
Для верификации данных о лесных пожарах реализована модель оценки площадей возгораний на основе Random Forest и набора вегетационных индексов, характеризующих степень выгорания и восстановление растительности. Точность распознавания предложенной модели на валидационной выборке для территории Киренского района за 2019 год составила 0.975 по метрике Accuracy, F1-score – 0.962.
Модели прогнозирования риска лесных пожаров на всю территорию исследования разработаны на основе методов машинного обучения Case-based reasoning (CBR), Random Forest (RF). С использованием метода автоматического машинного обучения AutoML (AutoGluon) реализованы модели для отдельных четырех кластеров лесничеств, полученных на основе метода K-means, с учетом схожести влияния географических факторов на возникновение пожаров.
Гибридная модель объединяет алгоритмы RF, CBR и AutoML, обеспечивая тем самым адаптацию модели к особенностям различных кластеров территорий. Для первого кластера территорий результат классификации формируется медианным голосованием трех бинарных моделей. Для кластеров № 2 и № 4 используется модель Random Forest, для кластера № 3 – AutoML. Такое распределение моделей основано на сравнении их эффективности по метрикам F1-score и Accuracy. Реализованная стратегия позволила адаптировать модель к различным географическим условиям и уменьшить долю ошибочных прогнозов.
Точность предложенной гибридной модели произведена на тестовых данных за различные периоды: 2008, 2016 и 2024 г. и составила F1-score – 0.894, Accuracy –0.892 , что превышает показатели базовых моделей и аналогичных решений.
Гибридная модель интегрирована в автоматизированную информационную систему прогнозирования риска лесных пожаров, обеспечивающую сбор, верификацию и визуализацию данных. Разработанное решение позволяет оперативно оценивать уровень пожарной опасности и может быть масштабировано для территорий с аналогичными природно-климатическими характеристиками.
Работа выполнена в рамках гранта № 075-15-2024-533 Министерства науки и высшего образования РФ на выполнение крупного научного проекта по приоритетным направлениям научно-технологического развития (проект «Фундаментальные исследования Байкальской природной территории на основе системы взаимосвязанных базовых методов, моделей, нейронных сетей и цифровой платформы экологического мониторинга окружающей среды»).

Ключевые слова: ДЗЗ, прогнозирование риска лесных пожаров, методы машинного обучения, Random Forest, CBR, AutoML, Иркутская область
Литература:
  1. Институт географии СО РАН [Электронный ресурс]. http://www.irigs.irk.ru/ (дата обращения: 13.05.2025).
  2. Иркутскстат. Территориальный орган Федеральной службы государственной статистики по Иркутской области. Население [Электронный ресурс]. https://38.rosstat.gov.ru/folder/167937 (дата обращения: 02.04.2023).
  3. ЛВПЦ. Леса высокой природоохранной ценности России. ЛВПЦ Иркутской области [Электронный ресурс]. https://hcvf.ru/ru/maps/hcvf-irkutsk (дата обращения: 30 марта 2025).
  4. Лупян Е.А., Лозин Д.В., Барталев С.А., Балашов И.В., Стыценко Ф.В. Оценка повреждений российских лесов пожарами в XXI веке на основе анализа интенсивности горения по данным прибора MODIS // Современные проблемы дистанционного зондирования Земли из космоса. 2024. Т. 21, № 6. С. 233–249.
  5. Bychkov I.V., Ruzhnikov G.M., Fedorov R.K., Popova A.K., Avramenko Y.V. On classification of Sentinel-2 satellite images by a neural network ResNet-50 // Computer Optics. 2023. Vol. 47, No. 3. P. 474–481.
  6. Fick S.E., Hijmans R.J. WorldClim 2: new 1km spatial resolution climate surfaces for global land areas // International Journal of Climatology. 2017. Vol. 37, No. 12. P. 4302–4315.
  7. Saha S., Moorthi S., Pan H., Wu X., Wang J., Nadiga S., Tripp P., Kistler R., Woollen J., Behringer D. et al.* The NCEP Climate Forecast System Reanalysis // Bulletin of the American Meteorological Society. 2010. Vol. 91, No. 8. P. 1015–1058.
  8. Saha S., Moorthi S., Wu X., Wang J., Nadiga S., Tripp P., Behringer D., Hou Y.-T., Chuang H., Iredell M. et al.* The NCEP climate forecast system version 2 // Journal of Climate. 2014. Vol. 27, No. 6. P. 2185–2208.

Технологии и методы использования спутниковых данных в системах мониторинга