XXII.F.306
Идентификация орошаемых агроценозов по данным дистанционного зондирования Земли с применением методов машинного обучения
Ермолаева О.С. (1), Зейлигер А.М. (2), Буравчиков Д.А. (1)
(1) РГАУ-МСХА им. К.А. Тимирязева, Москва, Россия
(2) Институт водных проблем РАН, Москва, Россия
Современное сельское хозяйство сталкивается с рядом серьезных проблем, таких как растущий спрос на продукты питания, изменения климата и истощение природных ресурсов. Для принятия обоснованных решений, которые приведут к улучшению производительности, снижению издержек и интенсификации сельскохозяйственного производства, необходим процесс непрерывного внедрения инноваций с использованием современных информационных технологий [1]. Для улучшения управления растениеводством, основными средствами которого являются пространственно распределенные объекты с ярко выраженной природной дифференциацией, важно опираться на данные, получение которых обеспечивается такими технологиями, как ГИС, ГНСС, ДЗЗ и IoT. Однако для повышения производительности системы требуется эффективное применение «больших данных» в сельском хозяйстве, что возможно благодаря обработке данных с использованием методов машинного обучения [2].
Орошаемые агроценозы с различными технологиями ведения поливного режима служат целям обеспечения устойчивого роста и развития сельскохозяйственных культур водой, поступающей из поверхностных и подземных водных объектов в условиях недостатка природной влаги (например, запасы почвенной влаги после снеготаяния и дождевые осадки). Орошение позволяет поддерживать оптимальные условия для растений, особенно в регионах с дефицитом осадков или нерегулярным климатом. Однако неэффективное использование воды приводит как к низким технико-экономическим показателям орошения, так и к негативным последствиям, таким как подъем грунтовых вод, засоление и осолонцевание почв, а также загрязнение окружающей среды с соответствующей деградацией её экологических функций. Для предупреждения и/или раннего обнаружения причин возникновения негативных процессов на орошаемых землях необходим мониторинг состояния этих земель и их влияния на связанные природные объекты. Однако такой мониторинг либо проводится по устаревшим методикам, либо не осуществляется вовсе, что является следствием технологического разрыва в данной отрасли [3].
Выход из сложившейся ситуации заключается в разработке новых методов и инструментов мониторинга, основанных на сочетании технологий ГИС-ДЗЗ-ГНСС-ИИ, а также в обучении настоящих и будущих специалистов отрасли навыкам обработки и применения геоданных, получаемых из различных источников.
В настоящей работе представлены результаты использования данных дистанционного зондирования Земли (ДЗЗ) космического сегмента для разработки методики идентификации границ контуров орошаемых агроценозов на основе методов машинного обучения с целью автоматизации этого процесса и повышения точности его результатов. Объектом исследования стала сельская территория, расположенная в Энгельском районе Саратовской области, недалеко от поселка Степное, на правом берегу реки Волги. Эта территория относится к зоне неустойчивого увлажнения с характерными засухами, возникающими в течение вегетационного периода; поэтому для получения устойчивых урожаев используется орошение. На данной территории орошение посевов осуществляется дождевальными машинами кругового и фронтального действия.
Центральным элементом данной работы являются алгоритмы машинного обучения, основанные на анализе спутниковых снимков Sentinel-2. Для доступа к архивам снимков и обработки данных было решено использовать сервис Google Earth Engine (GEE). Earth Engine представляет собой многопетабайтный каталог данных, интегрированный с высокопроизводительным кластером серверов для параллельных вычислений. Доступ к системе и управление ей осуществляется через интерфейс прикладного программирования (API). В интерактивной среде разработки (редакторе кода) на JavaScript API был создан сценарий для подбора датасета и его последующей обработки.
В интерактивной среде разработки (редакторе кода) на JavaScript API был создан сценарий для подбора датасета и его последующей обработки. Для заданного интервала времени и выбранного экстента территории (AOI — area of interest) реализован подбор данных Sentinel-2, а также маскирование изображений для удаления пикселей, представляющих облачность или тень от облаков. Далее для каждого тайла были рассчитаны спектральные индексы NDVI, EVI, NDMI, WBI, NDWI и SAVI. Временные ряды индексов растительности были использованы в качестве входных данных для обучения моделей машинного обучения с использованием двух выбранных методов [4]: 1) без учителя (алгоритм K-Means — кластеризация с использованием метода ближайших соседей); 2) с учителем (алгоритм Random Forest). Верификация метода была проведена сопоставлением результатов идентификации тестового участка с данными наземного подспутникового мониторинга.
Составленный сценарий в GEE работает под управлением оператора, который задает границы исследуемых экстентов сельской территории и требуемые интервалы времени. После запуска код управляет: а) поиском на облачном сервере доступных космоснимков с заданными параметрами; б) проведением расчетов; в) сохранением результатов расчетов на Google Drive; г) визуализацией результатов расчетов в пользовательском интерфейсе составленного скрипта.
Сегментация изображения с использованием алгоритма без учителя проводилась с установлением числа кластеров k = 5. Верификация полученных результатов показала хорошую корреляцию с данными подспутникового мониторинга (0.85). Однако в кластер орошаемых территорий также были включены лесополосы и древесно-кустарниковая растительность, которая, обладая значительной корневой системой, может забирать почвенную влагу из более глубоких слоев. Одним из возможных решений для исключения отнесения алгоритмом территорий с древесно-кустарниковой растительностью является использование маскирования данных этих участков.
Для применения алгоритма Random Forest был создан обучающий набор данных, в котором были размечены орошаемые и неорошаемые агроценозы на исследуемой области. Затем этот набор был разделен на учебные и проверочные данные. Точность работы полученной модели на основе алгоритма Random Forest составила 0.94, при этом необходимо отметить, что в категорию орошаемых агроценозов не попадали территории с древесно-кустарниковой растительностью.
В данном исследовании использовались данные Sentinel-2, наземные данные и подходы машинного обучения для классификации территории на орошаемые и не орошаемые участки. Результаты подтверждают, что классификация орошаемых агроценозов может быть выполнена с использованием изображений Sentinel-2 (точность модели на основе алгоритма Random Forest составила 0.94, корреляция результатов K-Means с данными подспутникового мониторинга — 0.85). Созданные картограммы могут служить опорными данными для лиц, принимающих решения о развитии устойчивого сельского хозяйства и управления водными ресурсами в регионе. В ходе дальнейших исследований можно рассмотреть возможность использования радиолокационных данных Sentinel-1 для улучшения временного разрешения в тех случаях, когда облачное покрытие препятствует использованию оптических данных. Это требует дальнейших исследований, направленных на валидацию разработанного метода для других регионов ведения орошаемого земледелия, с различными сельскохозяйственными культурами, а также в годы с различной естественной увлажненностью.
Благодарности: Исследование выполнено за счет средств гранта Российского научного фонда №23-27-00438, https://rscf.ru/project/23-27-00438/.
Ключевые слова: дистанционное зондирование Земли, Sentinel-2, кластеризация, Random Forest, спектральные индексыЛитература:
- Зейлигер, А. М. Информационные технологии в мониторинге богарных и орошаемых агроценозов / А. М. Зейлигер, О. С. Ермолаева // Современные наукоемкие технологии. – 2016. – № 10-1. – С. 62-66.
- Radulović, Mirjana, Sanja Brdar, Branislav Pejak, Predrag Lugonja, Ioannis Athanasiadis, Nina Pajević, Dragoslav Pavić, and Vladimir Crnojević. 2023. “Machine Learning-Based Detection of Irrigation in Vojvodina (Serbia) Using Sentinel-2 Data.” GIScience & Remote Sensing 60 (1). doi:10.1080/15481603.2023.2262010.
- Zeyliger, A. M. Assessment of Irrigation Efficiency by Coupling Remote Sensing and Ground-Based Data: Case Study of Sprinkler Irrigation of Alfalfa in the Saratovskoye Zavolgie Region of Russia / A. M. Zeyliger, O. S. Ermolaeva, V. V. Pchelkin // Sensors. – 2023. – Vol. 23, No. 5. – P. 2601.
- Kulkarni, A. D., and B. Lowe. 2016. “Random Forest Algorithm for Land Cover Classification.” International Journal on Recent and Innovation Trends in Computing and Communication 4 (3): 58–63.
Презентация доклада
Ссылка для цитирования: Ермолаева О.С., Зейлигер А.М., Буравчиков Д.А. Идентификация орошаемых агроценозов по данным дистанционного зондирования Земли с применением методов машинного обучения // Материалы 22-й Международной конференции «Современные проблемы дистанционного зондирования Земли из космоса». Москва: ИКИ РАН, 2024. C. 178. DOI 10.21046/22DZZconf-2024aДистанционное зондирование растительных и почвенных покровов
178