XXII.A.42
Оценка распаханности участков личных подсобных хозяйств с использованием методов машинного обучения по данным Sentinel-2
Сабаев А.А. (1), Понькина Е.В. (1)
(1) Алтайский государственный университет, Барнаул, Россия
Личные подсобные хозяйства (ЛПХ) играют важную роль в обеспечении продовольственной безопасности населения (Калафатов, 2021; Лайпанова, 2019). В последние годы в виду разнообразных причин режим использования участков ЛПХ в границах населенных пунктов претерпевает изменения – сокращается площадь обрабатываемой пашни, значительное распространение получило забрасывание или неиспользование земельных участков, их закустаривание и «запустение». Забрасываемость участков ЛПХ, как и снижение площадей или отсутствие культивации пашни, являются индикаторами социальных и экономических изменений в сельских территориях, отчасти, связанных с оттоком населения, снижением экономической привлекательности содержания и обработки участка, как и в целом изменения модели поведения современного сельского населения и развитием форм альтернативной занятости. Среди негативных последствий забрасываемости участков ЛПХ исследователи выделяют следующие: накопление значительной массы сухой растительности, увеличение рисков и площадей распространения пожаров, распространение сорной растительности, инвазивных растений (в том числе борщевика Сосновского), скопление диких животных как разносчиков инфекций, снижение производства продукции сельского хозяйства и общей эстетической привлекательности сельского ландшафта (Фокин, 2016). Среди положительных последствий выделяют – восстановление природной среды и снижение выброса парниковых газов (Hawes et al., 2024). Одним из аспектов исследования режимов использования участков ЛПХ является оценка степени распаханности, базирующаяся на детектировании наличия и площади пашни, показывающая долю культивируемой пашни от общей площади участка. Разработка инструментов мониторинга режимов использования участков ЛПХ, в частности степени распаханности имеет важное значение для отслеживания изменения землепользования в сельских территориях и выработки решений по повышению эффективности использования и управления земельными ресурсами. Мониторинг степени распаханности участков ЛПХ важен и с позиции уточнения баланса парниковых газов от хозяйственной деятельности, что особенно актуально в текущей климатической повестке.
Целью работы является разработка и апробация геоинформационной технологии для детектирования наличия пашни и оценки степени распаханности участков ЛПХ в границах населенных пунктов на основе разновременных спутниковых данных Sentinel-2.
Обзор существующих решений в области методов обработки данных дистанционного зондирования земли для решения задач детектирования наличия пашни и оценки степени распаханности участков ЛПХ показал существенный пробел в этой области. Преимущественно большинство решений связаны с классификацией участков по видам землепользования по данным Modis (Alcantara et al., 2012; Kolecka, 2021), Landsat (Dara et al., 2018; Löw et al., 2015; Witmer, 2008), Sentinel (Goga et al., 2020; Morell-Monzó et al., 2023; Visockiene et al., 2019), либо их сегментацией с последующей классификацией, и детектированием культивации пашни. При этом отсутствие признаков культивации пашни в течение нескольких лет является одним из признаков забрасываемости пашни. Отдельный блок исследований связан с оценкой возможностей по вовлечению в оборот заброшенных участков пашни, включающий оценку степени закустаривания или залесения и общей пригодности (Pazur et al., 2021). В качестве методов классификации спутниковых данных чаще всего используется различный инструментарий – кластерный анализ (Goga et al., 2020), дискриминантный анализ (Терехин, 2017), регрессионные методы (Laue, Arima, 2016), нейронные сети и разнообразные методы машинного обучения (Löw et al., 2015; Morell-Monzó et al., 2023), демонстрирующие достаточно высокую точность. Детектирование распашки опирается на использование коллекции разновременных спутниковых изображений, описывающих динамику вегетации растительности, зачастую для анализа используются тренды вегетационных индексов или их обобщенные характеристики (Kolecka, 2021; Witmer, 2008; Löw et al., 2015; Goga et al., 2020; Morell-Monzó et al., 2023; Терехин, 2017). Однако, участки ЛПХ имеют свою специфику в виду малых размеров, размещения вблизи пашни других объектов (здания и сооружения, посадки плодовых деревьев и кустарников и пр.). Поэтому одним из вопросов являлось исследование точности применения методов машинного обучения по данным Sentinel-2 для решения поставленных задач.
В качестве тестовой территории рассматривается территория села Кытманово и прилегающие поселки Тягун и Кытманушка, Кытмановского района Алтайского края. На данной территории были отобраны 713 участков ЛПХ. Границы участков были размечены вручную по данным спутниковой съемки сверхвысокого разрешения Maxar (0,6 м/пиксель). Для 364 участков выполнено визуальное дешифрирование в виде полигонов основных объектов участков ЛПХ – пашня (класс 1), здания и сооружения (класс 2), прочие объекты (класс 3). В данную группу попали только те участки, которые с большой точностью возможно определить визуально по снимкам высокого разрешения. Размеченные участки были разбиты на две подвыборки тренинговую (70% выборки) и тестовую (30%). За период вегетации с 4 мая по 9 сентября 2022 годы было использовано 19 спутниковых снимков Sentinel-2 с атмосферной коррекцией и безоблачностью над территорией исследования, по данным которых вычислены временные ряды вегетационных индексов и индексов влажности растительности GNDVI, MCARI, MSI и NDMI и их статистики в целом за вегетационный период включая – максимум, минимум, медиана, сумма, размах и др. В качестве референсной модели классификации использована логистическая регрессия, которая позволила выявить наиболее значимые предикторы и сократить признаковое пространство. Общее количество предикторов составило 27. На основе тренинговой выборки были обучены 4 модели машинного обучения – градиентный бустинг, деревья решений, случайный лес и метод опорных векторов. Классификация выполнена на уровне пикселей. Точность моделей классификации оценивалась с использованием общей метрики точности (Overall Accuracy), точности производителя (Producer’s Accuracy) и точности пользователя (User’s Accuracy). Спутниковые данные обработаны средствами языка Python, обработка данных и обучение моделей классификации выполнены на языке R. Для визуализации результатов используются средства QGIS.
Результаты расчета показали, что по тренинговой выборке участков наивысшую точность демонстрирует случайный лес для объектов всех классов (>90%). Однако, для тестовой выборки более высокую точность (>70%) демонстрирует метод градиентного бустинга, в то время как случайный лес дает точность для некоторых классов только на уровне 66%. Наименее эффективным методом оказались деревья решений, для которого оценки точности варьируются по классам при минимальной величине 58%. По результатам сравнительного анализа методов на основе градиентного бустинга выполнена итоговая предиктивная классификация всех участков территории. Оценка степени распаханности участка выполнена на основе попиксельной классификации как отношение количества пикселов, классифицированных как класс «пашня» к общему количеству пикселов участка, попадающего в полигон, выраженной в процентах.
Результаты классификации были картированы с использованием цветовой шкалы степени распаханности от 0 до > 90%. В целом на рассматриваемой территории по состоянию на 2022 год около 15% всех участков имеет распаханность менее 10%, низкий уровень распашки (от 0 до 20%) имеет около 25% участков, средний уровень (от 20 до 50%) – около 48% участков, около 26% участков имеет высокий уровень распашки (более 50%).
Разработанный инструментарий представляется перспективным для внедрения в систему мониторинга режимов использования участков ЛПХ на уровне сельских населенных пунктов, в частности отслеживания площадей пашни и забрасываемости участков. Развитие рассматриваемого инструментария предполагает дополнение алгоритма на первом этапе машинной сегментацией и выделением участков ЛПХ, с последующей классификацией территории участка на зоны по видам объектов и оценкой степени распаханности. Анализ пространственных паттернов как и поиск факторов культивации пашни на участках ЛПХ в населенных пунктах представляет интерес для дальнейшего исследования.
Ключевые слова: степень распаханности, личное подсобное хозяйство, Sentinel-2, машинное обучение, градиентный бустинг, вегетационные индексы, индексы влажностиЛитература:
- Калафатов Э.А. Роль личных подсобных хозяйств в развитии продовольственной безопасности России и сельских территорий // Научный вестник: финансы, банки, инвестиции. 2021. № 4 (57). С. 79-93.
- Лайпанова З.М. Роль и значение личных подсобных хозяйств населения // Вестник Евразийской науки. 2019. Т. 11. № 6. С. 1-8.
- Терехин Э.А. Распознавание залежных земель на основе сезонных значений вегетационного индекса NDVI // Компьютерная оптика. 2017.Т. 41. № 5. С. 719-725.
- Фокин В.Я. Социальные контрасты сельской культуры в условиях ликвидации селообразующих предприятий // Дискуссия. 2016. № 3(66). С. 96-102.
- Alcantara C., Kuemmerle T., Prishchepov A.V., Radeloff V.C. Mapping abandoned agriculture with multi-temporal MODIS satellite data // Remote Sensing of Environment. 2012. V. 124. Pp. 334-347. DOI: 10.1016/j.rse.2012.05.019
- Dara, A.; Baumann, M.; Kuemmerle, T.; Pflugmacher, D.; Rabe, A.; Griffiths, P.; Hölzel, N.; Kamp, J.; Freitag, M.; Hostert, P. Mapping the Timing of Cropland Abandonment and Recultivation in Northern Kazakhstan Using Annual Landsat Time Series // Remote Sens. Environ. 2018. V. 213. Pp. 49–60. DOI: https://doi.org/10.1016/j.rse.2018.05.005.
- Goga T., Szatmári D., Feranec J., Papčo J. Abandoned agricultural land identification using object-based approach and sentinel data in the Danubian Lowland, Slovakia // Int. Arch. Photogramm. Remote Sens. Spatial Inf. Sci. 2020. Vol. XLIII-B3. P. 1539-1545. DOI: 10.5194/isprs-archives-XLIII-B3-2020-1539-2020
- Hawes J.K., Goldstein B.P., Newell J.P. et al. Comparing the carbon footprints of urban and conventional agriculture // Nature Cities. 2024. Vol. 1. P. 164-173. DOI: https://doi.org/10.1038/s44284-023-00023-3
- Kolecka N. Greening trends and their relationship with agricultural land abandonment across Poland // Remote Sensing of Environment. 2021. Vol. 257. DOI:10.1016/j.rse.2021.112340
- Laue J., Arima E. Spatially explicit models of land abandonment in the Amazon // Journal of Land Use Science. 2016. Vol. 11. N. 1. P. 48-75. DOI:10.1080/1747423X.2014.993341
- Löw F., Fliemann E., Abdullaev I., Conrad C., Lamers J.P.A. Mapping abandoned agricultural land in Kyzyl-Orda, Kazakhstan using satellite remote sensing // Applied Geography. 2015. Vol. 62. P. 377-390. DOI:10.1016/j.apgeog.2015.05.009
- Morell-Monzó S., Sebastiá-Frasquet M., Estornell J., Moltó E. Detecting abandoned citrus crops using Sentinel-2 time series. A case study in the Comunitat Valenciana region (Spain) // ISPRS Journal of Photogrammetry and Remote Sensing. 2023. Vol. 201. P. 54-66. DOI:10.1016/j.isprsjprs.2023.05.003
- Pazur, R.; Verburg, P. H.; Bürgi, M.; Prishchepov, A. V.; Myachina, K.; Levykin, S.; Kazachkov, G.; Yakovlev, I.; Ponkina, E. V.; Rogova, N.; Akhmetov, R. Restoring Steppe Landscapes: Patterns, Drivers and Implications in Russia’s Steppes // Landsc. Ecol. 2021. V. 36 (2). DOI: https://doi.org/10.1007/s10980-020-01174-7.
- Visockiene J.S., Tumeliene E., Maliene V. Analysis and identification of abandoned agricultural land using remote sensing methodology // Land Use Policy. – 2019. – Vol. 82. – P. 709-715.
- Witmer F.D.W. Detecting war‐induced abandoned agricultural land in northeast Bosnia using multispectral, multitemporal Landsat TM imagery // International Journal of Remote Sensing. – 2008. – Vol. 29. – no. 13. – P. 3805-3831.
Презентация доклада
Ссылка для цитирования: Сабаев А.А., Понькина Е.В. Оценка распаханности участков личных подсобных хозяйств с использованием методов машинного обучения по данным Sentinel-2 // Материалы 22-й Международной конференции «Современные проблемы дистанционного зондирования Земли из космоса». Москва: ИКИ РАН, 2024. C. 58. DOI 10.21046/22DZZconf-2024aМетоды и алгоритмы обработки спутниковых данных
58