Войти на сайт
МЕЖДУНАРОДНЫЕ ЕЖЕГОДНЫЕ КОНФЕРЕНЦИИ
"СОВРЕМЕННЫЕ ПРОБЛЕМЫ ДИСТАНЦИОННОГО
ЗОНДИРОВАНИЯ ЗЕМЛИ ИЗ КОСМОСА"
(Физические основы, методы и технологии мониторинга окружающей среды, природных и антропогенных объектов)

Двадцать первая международная конференция "СОВРЕМЕННЫЕ ПРОБЛЕМЫ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ ИЗ КОСМОСА"

Участие в конкурсе молодых ученых Участие в Школе молодых 

XXI.A.86

NorthFlux: ансамбль моделей машинного обучения для оценки потоков углерода в Северном полушарии по данным ДЗЗ

Розанов А.П. (1), Грибанов К.Г. (1)
(1) Уральский федеральный университет, Екатеринбург, Россия
Вследствие текущего глобального изменения климата, вызванного ростом концентрации парниковых газов в земной атмосфере, существует необходимость точной количественной оценки восходящих и нисходящих потоков углерода в наземных экосистемах. Существующие наземные микрометеорологические методы, такие как метод турбулентных пульсаций (англ.: eddy covariance), не обеспечивают достаточное пространственное покрытие для получение глобальной оценки углеродного цикла. Одним из перспективных подходов в решении данной задачи является масштабирование (англ.: upscaling) точечных измерений потоков, используя алгоритмы машинного обучения (МО) и искусственного интеллекта (ИИ), обученные на данных дистанционного зондирования Земли (ДЗЗ) и климатического реанализа.
В последние годы был опубликован ряд работ [1-3], посвященных сравнению и применению различных методов МО для оценки потоков углерода и созданию глобальных датасетов, полученных с помощью этих алгоритмов. Однако вследствие разрозненности и неоднородности спутниковых данных, подаваемых на вход моделей, главными проблемами являются временное и пространственное разрешение генерируемых данных, а также невысокая точность получаемых оценок.
Целью данной работы являлось создание ансамбля моделей МО для оценки нисходящих (чистая валовая продукция - GPP), восходящий (экосистемное дыхание - RECO) потоков углерода и чистого экосистемного обмена в Северном полушарии с пространственным разрешением 0.05°C и суточным временным разрешением.
В качестве аппроксимируемых значений использовались измерения со 180 станций в Северном полушарии глобальной сети FLUXNET [4] за период с 2000 по 2014 годы. Для каждой вышки были получены временные ряды следующих параметров:
-NEE_VUT_REF: NEE, полученный путем суммирования часовых инструментальных наблюдений;
-RECO_NT_VUT_REF: RECO, оцениваемый путем расширения ежечасных измерений в ночное время;
-GPP_NT_VUT_REF: GPP, определяемый как разница между NEE и RECO;
Некоторые из предоставленных измерений были восстановлен различными регрессионными алгоритмами, поэтому, чтобы уменьшить ошибку, распространяющуюся с данными, параметр NEE_VUT_REF_QC был извлечен вместе с целевыми переменными, а затем каждое значение NEE с QC ниже 0,9 было отфильтровано.
В данный работе в качестве данных ДЗЗ были использованы два продукта спектрорадиометра MODIS: MOD09CMG v6.1 [5] и MCD12C1 v6.1 [6]. Первый представляет собой глобальный набор данных, содержащий отражательную способность поверхности в 7 спектральных интервалах, яркостную температуру в 4 спектральных интервалах и несколько параметров орбиты. Эти данные были предварительно обработаны авторами продукта и представлены на регулярной сетке с пространственным разрешением 0.05° и временным разрешением 1 день.
Продукт MCD12C1 содержит классификации растительного покрова трех различных типов: IGBP, UMD и LAI . Для целей данной работы была использована классификация IGBP [7] как имеющая наибольшее количество типов экосистем. В общей сложности из этого продукта было собрано 20 предикторов: 18 представляли процент принадлежности пикселя к каждому классу, а 2 других представляли оценку качества и класс большинства соответственно.
Также для выбранных станций FLUXNET были получены временные ряды реанализы ERA5 on single levels [8] с пространственным разрешением 0.25° и часовым временным. Чтобы согласовать эти данные с целевыми показателями и предикторами из продуктов MODIS, ряды были ежедневным наблюдениям. Всего в окончательный набор данных было включено 11 переменных реанализа: две составляющие ветра (u_wind, v_wind), температура воздуха на высоте 2 м (2m_tem), температура точки росы на высоте 2 м (2m_dew), температура поверхности (skin_tem), общее количество осадков (tp), чистая поверхностная солнечная радиация (nssr), приземное давление (pressure), низкий растительный покров (lvc), высокий растительный покров (hvc) и испаряемость (evaporation). В качестве одной из уникальных особенностей этой работы для nssr и tp была рассчитана скользящая сумма за 7 и 30 дней для учета накопленной солнечной энергии и воды в экосистемах, что привело к четырем дополнительным переменным: nnsr_7, nssr_30, tp_7, tp_30. Кроме того, к сформированному списку предикторов в качестве временной составляющей была добавлена переменная, указывающая на месяц наблюдения.
Созданный набор данных далее был использован при обучении четырех широко известных алгоритмов МО: искусственная нейронная сеть (ANN) [9], случайный лес (RF) [10], адаптивный бустинг (AdaBoost) [11] и градиентный бустинг (XGBoost) [12].
При валидации результатов обучения было определен, в целом все четыре типа моделей были достаточно точными при оценке GPP, RECO и NEE, однако медианный ансамбляевый прогноз всегда имел самую низкую среднюю квадратичную ошибку (MSE) и самый высокий коэффициент детерминации (R2): для GPP MSE = 2.012 гCм-2д-1 и R2 = 0.884, для RECO MSE = 0.837 гCм-2д-1 и R2=0.883, для NEE MSE = 1.454 гCм-2д-1 и R2 = 0.773.
Чтобы дополнительно проверить работоспособность моделей на не видимых этого данных и сравнить их с существующими датасетами, оценивающими потоки CO2, мы использовали временные ряды сети AmeriFlux [13], предоставляющие наземные измерения в том же унифицированном формате, что и FLUXNET. В общей сложности, наблюдения 18 вышек в Северной Америке были выбраны в качестве целевых значений, и оценки продукта FluxCom [1] были сопоставлены с прогнозами текущего продукта (NorthFlux) для этих станций. Для данного набора данных продукт North Flux продемонстрировал MSE гиже на 29,97%, 45,42% и 31,51% для GPP, RECO и NEE соответственно.

Благодарность: исследование выполнено при поддержке Министерства высшего
образования и науки РФ (проект NoFEUZ-2023-0023).

Ключевые слова: машинное обучение, потоки углерода, карбоновый цикл, FLUXNET, MODIS
Литература:
  1. Jung M. et al. Scaling carbon fluxes from eddy covariance sites to globe: synthesis and evaluation of the FLUXCOM approach. – 2020.
  2. Tramontana G. et al. Predicting carbon dioxide and energy fluxes across global FLUXNET sites with regression algorithms //Biogeosciences. – 2016. – Т. 13. – №. 14. – С. 4291-4313.
  3. Zeng J. et al. Global terrestrial carbon fluxes of 1999–2019 estimated by upscaling eddy covariance data with a random forest //Scientific data. – 2020. – Т. 7. – №. 1. – С. 313.
  4. Baldocchi D. et al. FLUXNET: A new tool to study the temporal and spatial variability of ecosystem-scale carbon dioxide, water vapor, and energy flux densities //Bulletin of the American Meteorological Society. – 2001. – Т. 82. – №. 11. – С. 2415-2434.
  5. Vermote E., Wolfe R. MODIS/Terra surface reflectance daily L2G Global 1km and 500m SIN Grid V061 //NASA EOSDIS Land Processes DAAC. – 2021.
  6. Friedl M., Sulla-Menashe D. MODIS/Terra+ Aqua Land Cover Type Yearly L3 Global 500m SIN Grid V061 //NASA EOSDIS Land Processes DAAC: Sioux Falls, SD, USA. – 2022.
  7. Loveland T. R., Belward A. S. The international geosphere biosphere programme data and information system global land cover data set (DISCover) //Acta Astronautica. – 1997. – Т. 41. – No. 4-10. – С. 681-689.
  8. Hersbach, H., Bell, B., Berrisford, P., Biavati, G., Horányi, A., Muñoz Sabater, J., Nicolas, J., . Peubey, C., Radu, R., Rozum, I., Schepers, D., Simmons, A., Soci, C., Dee, D., Thépaut, J-N. (2023): ERA5 hourly data on single levels from 1940 to present. Copernicus Climate Change Service (C3S) Climate Data Store (CDS), DOI: 10.24381/cds.adbb2d47
  9. Kubat M. Neural networks: a comprehensive foundation by Simon Haykin, Macmillan, 1994, ISBN 0-02-352781-7 //The Knowledge Engineering Review. – 1999. – Т. 13. – No. 4. – С. 409-412.
  10. Breiman L. Random forests //Machine learning. – 2001. – Т. 45. – С. 5-32.
  11. Drucker H. Improving regressors using boosting techniques //Icml. – 1997. – Т. 97. – С. 107-115.
  12. Chen T., Guestrin C. Xgboost: A scalable tree boosting system //Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining. – 2016. – С. 785-794.
  13. Novick K. A. et al. The AmeriFlux network: A coalition of the willing //Agricultural and Forest Meteorology. – 2018. – Т. 249. – С. 444-456.

Презентация доклада

Методы и алгоритмы обработки спутниковых данных

43