Войти на сайт
МЕЖДУНАРОДНЫЕ ЕЖЕГОДНЫЕ КОНФЕРЕНЦИИ
"СОВРЕМЕННЫЕ ПРОБЛЕМЫ ДИСТАНЦИОННОГО
ЗОНДИРОВАНИЯ ЗЕМЛИ ИЗ КОСМОСА"
(Физические основы, методы и технологии мониторинга окружающей среды, природных и антропогенных объектов)

Двадцать третья международная конференция "СОВРЕМЕННЫЕ ПРОБЛЕМЫ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ ИЗ КОСМОСА"

Участие в XXI Международной научной Школе-конференции молодых ученых по фундаментальным проблемам дистанционного зондирования Земли из космоса Участие в конкурсе молодых ученых 

XXIII.F.450

Детектирование сельскохозяйственных культур по данным ДЗЗ и метеорологическим данным

Богдан Е. В. (1,2), Цымбарович П.Р. (1), Фомин Д. С. (1), Филь П. П. (1)
(1) Почвенный институт им. В. В. Докучаева, Москва, Россия
(2) МГУ имени М.В. Ломоносова, факультет почвоведения, Москва, Россия
Формирование достоверных карт размещения культур способствует эффективному управлению сельскохозяйственными ресурсами. Такие тематические карты используются для оценки объёмов выращивания культур, моделирования урожайности, анализа пространственных рисков и комплексного мониторинга землепользования, а также способствуют повышению эффективности государственного контроля и адаптации к климатическим изменениям. Поскольку получение фактической информации проблематично из-за отсутствия систем контроля и сбора информации для формирования таких карт используют данные дистанционного зондирования земли.
Целью настоящей работы стало создание модели распознавания сельскохозяйственных культур для мониторинга сельского хозяйства.
Входными данными являлись открытые картографические ресурсы разных стран — растровые и векторные материалы, как о фактической структуре посевных полей, так и карты, созданные с использованием алгоритмов машинного обучения (случайный лес, деревья решений). Прогнозные карты, построенные алгоритмами машинного обучения, подвергались постобработке для отбора данных с репрезентативными характеристиками и фильтрации картографических артефактов.
Обработка больших массивов картографических данных производилась на Python с помощью библиотек (rioxarray, rasterio, fiona). Для выгрузки спутниковых снимков использовалась платформа Google Earth Engine применялся. Алгоритм, который использовался для построения карт - градиентный бустинг (CatBoost).
В качестве признаков использовались спектральные характеристики Landsat, а именно медианные значения каналов Red, NIR, Blue, Green, SWIR1, SWIR2 за апрель–октябрь. Также были добавлены фенологические параметры, полученные по параметрам двойной логистической функции индексов WRDVI, NDMI, а также статистические характеристики индекса NDYI, отобранных на основе максимальных различий между культурами. Для повышения корректности итоговых карт использовался фильтр Хампеля — удалялись выбросы и артефакты прогнозных карт.
Для учета пространственной вариабельности, так как данные для тренировочной выборки расположены в разных климатических зонах, тренировочная выборка была дополнена суммой активных температур и осадков по данным климатического реанализа ERA5.
В итоговую модель вошли 134 признака, и для применения такой модели требовалось бы большое количество вычислительных ресурсов, поэтому количество признаков было сокращено до 24 с помощью встроенного метода Recursive Feature Elimination.
В результате были сформированы пространственно-распределенная карты по двенадцати культурам. Полученная модель классифицировала основные культуры РФ с общим F1 = 0,74. Оценка качества была проведена на данных селекционных центров РФ – Северо-Кавказский ФНАЦ, ОПХ Рассвет, ВНИИМЗ.
Поскольку тренировочная и валидационная выборки сильно отличались между собой (это объяснимо тем, что на некоторые данные нет аналогов среди зарубежных датасетов, например, Тверская и Московская области) было выполнено дообучение модели на валидационных данных. Общий F1 на дообученной модели на выборках составил: Северо-Кавказский ФНАЦ – 0,75, ОПХ Рассвет – 0,70, ВНИИМЗ – 0,45.

Ключевые слова: ДДЗЗ, ERA5, посевная структура, мониторинг сельского хозяйства

Дистанционное зондирование растительных и почвенных покровов