Двадцать первая международная конференция "СОВРЕМЕННЫЕ ПРОБЛЕМЫ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ ИЗ КОСМОСА"
XXI.F.87
Геопространственное моделирование характеристик лесов для тестовых полигонов национальной системы мониторинга климатически активных веществ на территории России
Гаврилюк Е.А. (1)
(1) Центр по проблемам экологии и продуктивности лесов РАН, Москва, Россия
В докладе представлены первые результаты геопространственного моделирования на основе данных ДЗЗ ряда качественных и количественных характеристик лесов, необходимых для оценки пулов углерода на территории тестовых полигонов (ТП) интенсивного типа, входящих в формирующуюся в настоящее время сеть мониторинга климатически активных веществ России (РИТМ углерода, 2023).
В 2023 году проводились работы по закладке наземных пробных площадей (НПП) на трех лестных ТП в республиках Карелия и Коми, а также в Нижегородской области, площадь каждого из которых составляет около 4 кв. км. Для обучения моделей использовались измерения, собранные процессе экспресс-оценки характеристик лесов полигонов – это от 300 до 400 рекогносцировочных круговых площадок переменного или постоянного радиуса, на которых оценивался достаточно широкий спектр таксационных, геоботанических и почвенных показателей.
В качестве геопространственных переменных для моделирования использовались доступные на территорию ТП материалы спутниковой и аэросъемки различных типов, а также производные от них тематические продукты. В состав базовых исходных данных, которые (условно) доступны для любого ТП в любой момент времени, входят разносезонные мультиспектральные и радарные изображения высокого пространственного разрешения со спутников Sentinel-1 (ESA Sentinel-2, 2023), Sentinel-2 (ESA Sentinel-2, 2023) и ALOS-2 (Global…, 2023), цифровая модель высот местности (ЦММ) Copernicus DEM GLO-30 (Copernicus…, 2023) и ее стандартные производные (крутизна и ориентация склона), а также пространственные координаты (широта и долгота) расположения пикселей. В качестве дополнительных (или альтернативных) данных рассматривались материалы беспилотной аэросъемки, которые включают в себя оптические цифровые и мультиспектральные ортофотопланы, а также результаты воздушного лазерного сканирования (ВЛС), продуктами тематической обработки которых являются цифровые модели рельефа и высот полога растительности (древостоя).
Использованная методика моделирования включала в себя следующие основные этапы:
(1) Подготовка независимых переменных для моделирования. Она включает в себя подбор исходных данных, их пространственное согласование, расчет производных переменных (индексов и т.п), а также различные математические и статистические преобразования, необходимые для корректного обучения моделей.
(2) Извлечение значений подготовленных независимых переменных в местах расположения НПП, для которых в процессе полевых работы были измерены значения необходимых для оценки пулов углерода показателей. Результатом является обучающая таблица, где значениям целевых характеристик сопоставлены значения геопространственных переменных.
(3) Обучение моделей. Для достижения наилучшего результата одновременно рассматривались несколько базовых методов машинного обучения, включая случайные леса (Breiman, 2001), метод опорных векторов (Cortes, Vapnik, 1995), градиентный бустинг (Chen, Guestrin, 2016), метод k ближайших соседей (Samworth, 2012) и генерализованные линейные модели (Friedman et al., 2010), а также варианты объединения предсказаний различных алгоритмов (Wolpert, 1992). В процессе обучения проводилась автоматическая оптимизация параметров используемых алгоритмов, а также оценка потенциальной эффективности их предсказаний с использованием методов кросс-валидации на обучающих данных. По результатам оценок эффективности определялся наилучший вариант модели, который затем использовался для предсказаний.
(4) Применение обученной модели ко всей территории ТП. Обученная модель использовалась для предсказаний значений целевой характеристики и сопутствующих показателей неопределенности моделирования для каждого пикселя исходных геопространственных переменных. На завершающем этапе на растровые результаты предсказаний накладывалась маска лесного покрова, чтобы оставить на тематическом изображении значения только для релевантных моделируемой характеристике пикселей.
Моделирование проводилось для показателей запаса стволовой древесины и возраста древостев, древесной фитомассы, породной структуры насаждений (преобладающая порода и доля хвойных пород в составе), типов (групп) почв и напочвенного покрова, а также мощности органогенного горизонта почвы. Рассматривались различные комбинации геопространственных переменных – только координаты, только оптические спутниковые данные, только спутниковые данные, только данные ВЛС, комбинация мультиспектральных спутниковых данных и материалов ВЛС.
В целом, несмотря на высокую плотность НПП на полигонах, использование данных ДЗЗ в качестве переменных в большинстве случаев позволяет значительно повысить эффективность моделирования по сравнению с вариантами использования только пространственных координат. Однако общая эффективность моделей, а также наилучшие комбинации переменных для моделирования, значительно варьировали для различных ТП и анализируемых показателей. Среди спутниковых данных основной вклад в результат вносят переменные на основе мультиспектральных изображений, роль радарных данных и ЦММ незначительна. Переменные на основе материалов ВЛС оказывают положительное влияние на эффективность моделирования запасов стволовой древесины и древесной фитомассы.
Для показателей запаса стволовой древесины (одной из наиболее значимых характеристик для оценки пулов углерода лесной экосистемы) коэффициент детерминации наилучших из полученных моделей варьировал для разных ТП в пределах 0,58-0,71 при величине корня из средней квадратической ошибки в диапазоне 18-28% от среднего запаса по НПП. Модели для древесной фитомассы имели почти такую же эффективность. Интегральная величина стандартной ошибки моделирования при оценке суммарной древесной фитомассы для разных ТП составила от 3 до 4,3%.
Работа выполнена в рамках реализации важнейшего инновационного проекта государственного значения «Разработка системы наземного и дистанционного мониторинга пулов углерода и потоков парниковых газов на территории Российской Федерации, обеспечение создания системы учета данных о потоках климатически активных веществ и бюджете углерода в лесах и других наземных экологических системах» (рег. № 123030300031-6).
Ключевые слова: лес, углерод, машинное обучение, данные ДЗЗ, БПЛА
Литература:
- РИТМ углерода – Российские инновационные технологии мониторинга углерода [Электронный ресурс]. URL: https://ritm-c.ru/ (дата обращения 07.10.2023)
- Breiman L. Random forests // Machine Learning. 2001. Vol. 45. №1. P. 5–32.
- Chen T., Guestrin C. XGBoost: A Scalable Tree Boosting System // In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD '16). Association for Computing Machinery, New York, NY, USA. 2016. P. 785–794. https://doi.org/10.1145/2939672.2939785
- Copernicus Digital Elevation Model Product Handbook [Электронный ресурс]. URL: https://spacedata.copernicus.eu/documents/20123/121239/GEO1988-CopernicusDEM-SPE-002_ProductHandbook_I4.0.pdf (дата обращения 07.10.2023).
- Cortes C., Vapnik V. Support-vector networks // Machine Learning. 1995. Vol. 20, №3. P. 273–297.
- ESA Sentinel-1 [Электронный ресурс]. URL:https://www.esa.int/Applications/Observing_the_Earth/Copernicus/Sentinel-1 (дата обращения 07.10.2023).
- ESA Sentinel-2 [Электронный ресурс]. URL: https://www.esa.int/Applications/Observing_the_Earth/Copernicus/Sentinel-2 (дата обращения 07.10.2023).
- Friedman J., Hastie T., Tibshirani R. Regularization Paths for Generalized Linear Models via Coordinate Descent // Journal of Statistical Software. 2010. Vol. 33(1). P. 1–22. doi:10.18637/jss.v033.i01.
- Global 25 m Resolution PALSAR-2 Mosaic (Ver.2.1.2) Dataset Decsription [Электронный ресурс]. URL:https://www.eorc.jaxa.jp/ALOS/en/dataset/pdf/DatasetDescription_PALSAR2_Mosaic_ver212.pdf (дата обращения 07.10.2023).
- Samworth R.J. Optimal weighted nearest neighbour classifiers // Annals of Statistics. 2012. Vol. 40. P. 2733–2763.
- Wolpert D.H. Stacked Generalization // Neural Networks. 1992. Vol.5(2). P. 241–259. https://doi.org/10.1016/S0893-6080(05)80023-1.
Презентация доклада
Видео доклада
Дистанционное зондирование растительных и почвенных покровов
357