Двадцать третья международная конференция "СОВРЕМЕННЫЕ ПРОБЛЕМЫ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ ИЗ КОСМОСА"
XXIII.F.140
Сравнение флористического и доминантного классификационных подходов для задач картографирования смешанных и широколиственных лесов Северо-Западного Кавказа с использованием данных ДЗЗ и методов машинного обучения
Гаврилюк Е.А. (1), Браславская Т.Ю. (1), Шевченко Н. Е. (1)
(1) Центр по проблемам экологии и продуктивности лесов РАН, Москва, Россия
Геопространственное моделирование, основанное на сочетании данных дистанционного зондирования и методов машинного обучения, в настоящее время является распространенным способом тематического картографирования лесных экосистем. Однако надежность результатов такого картографирования сильно зависит от способа интерпретации исходных данных, используемых для обучения модели, т.е. от выбранного способа классификации фитоценозов. В современной науке существуют различные подходы к классификации растительности, но большинство из них изначально разрабатывались независимо от практик современного цифрового картографирования и крайне редко сравнивались в контексте пригодности и относительных преимуществ для задач геопространственного моделирования. Чтобы заполнить этот пробел, мы проанализировали эффективность геопространственного моделирования для смешанных и широколиственных типов лесов, выделяемых на основе простого доминантного и более комплексного флористического (эколого-флористического) подходов.
Оба варианта классификации были применены к одному и тому же набору данных наземных обследований (515 пробных площадей), собранных на территории Северо-Западного Кавказа в 2014-2024 гг. Мы проанализировали геопространственные переменные, основанные на данных различных типов, включая оптические мультиспектральные спутниковые изображения Landsat и Sentinel-2 (Claverie et al., 2018), ЦМР (ESA, 2024) и ее производные, биоклиматические (Hijmans et al., 2005) и почвенные (Poggio et al., 2021) характеристики, для оценки их информативности и получения оптимальных комбинаций для последующего моделирования с помощью комплексной процедуры отбора признаков. Затем мы построили набор моделей с использованием различных комбинаций переменных и методов машинного обучения, включая экстремально рандомизованные деревья (Guerts et al., 2006), градиентный бустинг (Dorogush et al., 2018), линейный дискриминантный анализ (Fisher, 1936) и метод k ближайших соседей (Samworth, 2012) для обеих классификаций, и оценили их потенциальную точность на основе вложенной кросс-валидации.
В результате, типы леса, выделенные с помощью различных подходов, имели минимальную степень сходства между собой, как и составы соответствующих наборов переменных, отобранных для обучения моделей. Биоклиматические и почвенные переменные оказались более информативны, чем переменные, основанные на ЦМР и оптических спутниковых данных, несмотря на более грубое пространственное разрешение. Модели, основанные на флористической классификации, превзошли модели, основанные на доминантной классификации, по степени разделимости типов леса и потенциальной точности прогнозирования. Сбалансированная точность флористических моделей составила 83-91% для обобщённого варианта классификации (4 класса), и 51-58% для детального варианта (17 классов). Аналогичные показатели для доминантных моделей составили 70-76% (4 класса) и 43-47% (12 классов).
В итоге, флористическая классификация может быть предпочтительнее для лесов со сложным видовым составом не только с точки зрения экологического смысла, но и с точки зрения надежности потенциальных результатов геопространственного моделирования. В то же время следует отметить, что точность такого моделирования существенно зависит от требуемого уровня детализации классификации. Полученные результаты могут быть полезны для дальнейших работ, направленных на геопространственное моделирование или картографирование типов лесов Кавказа или аналогичных регионов, характеризующихся горным рельефом и/или сложным видовым составом древостоев.
Работа выполнена за счет гранта Российского научного фонда № 25-24-00169 «Геопространственное моделирование синтаксонов хвойно-широколиственных и широколиственных лесов Северо-Западного Кавказа».
Ключевые слова: классификация растительности, картографирование лесов, породный состав древостоев, горные леса, геопространственное моделирование, Северный Кавказ
Литература:
- Claverie M., Ju J., MasekJ. G., Dungan J. L., Vermote E.F., Roger J.-C., Skakun S. V., Justice, C. The Harmonized Landsat and Sentinel-2 surface reflectance data set // Remote Sensing of Environment. 2018. V. 219. P. 145-161.
- ESA (2024). Copernicus Global Digital Elevation Model [Электронный ресурс]. URL: https://doi.org/10.5069/G9028PQB (дата обращения 01.10.2025).
- Hijmans R.J., Cameron S.E., Parra J.L., Jones P.G., Jarvis A. Very High Resolution Interpolated Climate Surfaces for Global Land Areas // International Journal of Climatology. 2005. V. 25. P. 1965–1978. doi:10.1002/joc.12768.
- Poggio L., de Sousa L. M., Batjes N. H., Heuvelink G. B. M., Kempen B., Ribeiro E., Rossiter D. SoilGrids 2.0: producing soil information for the globe with quantified spatial uncertainty // SOIL. 2021. V. 7. P. 217–240. https://doi.org/10.5194/soil-7-217-2021.
- Geurts P., Ernst D., Wehenkel L. Extremely randomized trees // Machine Learning. 2006. V. 63. P. 3–42.
- Dorogush A.V., Ershov V., Gulin A. CatBoost: gradient boosting with categorical features support // arXiv:1810.11363. 2018.
- Fisher R.A.The use of multiple measurements in taxonomic problems // Annals of Eugenics. 1936. V. 7. P. 179–188.
- Samworth R.J. Optimal weighted nearest neighbour classifiers // Annals of Statistics. 2012. V. 40. P. 2733–2763.
Дистанционное зондирование растительных и почвенных покровов