Двадцать третья международная конференция "СОВРЕМЕННЫЕ ПРОБЛЕМЫ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ ИЗ КОСМОСА"
XXIII.A.506
Метод автоматического переноса тематических продуктов типа Scene Classification Land на данные прибора КМСС-2 (Метеор-М) на основе текстурных признаков, перцентильной нормализации и методов машинного обучения
Колбудаев П.А. (1), Плотников Д.Е. (1)
(1) Институт космических исследований РАН, Москва, Россия
Предварительная обработка спутниковых данных является одним из важных этапов при создании различных информационных продуктов, обеспечивая корректное восстановление безоблачных временных рядов спутниковых измерений (Plotnikov et al., 2022), а также необходимые условия для картографирования растительного покрова и его характеристик (Hermosilla et al., 2022, Matyukira et al., 2024, Плотников и др., 2018, Ёлкина и др., 2024, Плотников и др., 2025), оценке его состояния (Середа и др., 2020, Лупян и др., 2018, Дунаева и др., 2019, Страшная и др., 2014) и биофизических параметров (Шабанов и др., 2018, Плотников и др., 2025). Автоматическая оценка качества тематических продуктов, сопровождающих данные дистанционного зондирования Земли (ДЗЗ), таких как маски облачности и теней, имеет существенное значение для их последующего использования в различных прикладных задачах, включая создание обучающих выборок для сверточных нейронных сетей. Особую практическую ценность представляют методы, которые могут работать в автоматическом режиме и требуют минимального количества спектральных каналов, доступных в большинстве систем ДЗЗ.
Данные КМСС-М\КМСС-2 (аппараты серии Метеор-М) являются востребованными для решения задач дистанционной оценки характеристик земной поверхности, оперативного мониторинга и оценки растительного покрова России и континента (Kolbudaev et al., 2021, Plotnikov et al., 2023). В настоящее время в ИКИ РАН развиваются методы предварительной и тематической обработки данных приборов серии КМСС и поддерживается все большее число продуктов для решения множества задач спутникового мониторинга на основе этих данных (Плотников и др., 2020). В настоящей работе описаны результаты развития методов создания тематических продуктов по данным КМСС на уровне сцен.
В работе использовались согласованные по территории и времени (разница в моментах съемки не превышала 3 часов) пары сцен, полученные с приборов MSI (спутники Sentinel-2) и КМСС-2 (спутники «Метеор-М»). Данные MSI, характеризующиеся пространственным разрешением от 10 до 60 метров в зависимости от спектрального канала, были загрублены до разрешения 60 метров. Для обработки использовались три спектральных канала (зеленый, красный, ближний ИК), общие для обеих спутниковых систем.
В качестве исходного тематического продукта применялась маска Scene Classification Land (SCL), предоставляемая вместе с данными Sentinel-2 (Sentinel-2 User Handbook, 2015). Данный продукт содержит множественные тематические классы, включая различные типы облачности, теней, чистой поверхности, воды и снега. Для целей исследования была выполнена тематическая агрегация классов: все типы облаков и теней были объединены в единые классы «облачность» и «тени» соответственно, все типы чистой поверхности — в класс «чистая поверхность», классы воды и снега сохранены без изменений. Пиксели с маркировкой «неклассифицировано» (unclassified) и «нет данных» были отнесены к единой категории.
Для автоматической оценки качества агрегированной маски SCL использовались текстурные признаки, рассчитанные на основе матрицы совпадения уровней серого Grey Level Co-Occurrence Matrix (GLCM): Contrast, Dissimilarity, Homogeneity, Energy, Correlation и Entropy (Haralick et al., 1973). Признаки вычислялись для зеленого, красного и ближнего ИК каналов. Отдельным этапом являлся подбор оптимальных параметров расчета GLCM — размера анализируемого окна (patch_size) и расстояния сдвига (distance). Для этого вручную были отобраны 10 пар сцен Sentinel-2 с визуально высоким и низким качеством масок SCL, соответствующих сходным территориям и временным периодам. Для различных комбинаций параметров проводилось обучение классификатора Random Forest и оценка метрики F1-score на тестовых данных. Наилучшее разделение масок по качеству было достигнуто при значениях patch_size=20 и distance=1. В результате анализа значимости признаков было отобрано 6 наиболее информативных текстурных признаков, для расчета которых достаточно данных всего в двух спектральных каналах — зеленом и ближнем ИК.
Разработанный метод был применен для обработки сцен Sentinel-2 в зоне перекрытия с КМСС-2. Сцены разбивались на участки размером 512×512 пикселей с целью идентификации фрагментов с высококачественными масками SCL. Эти фрагменты использовались для формирования обучающей выборки, на основе которой обучался классификатор Random Forest, использующий перцентильные признаки трех спектральных каналов. Обученная модель применялась для построения тематической маски по данным КМСС-2 для каждой пары сцен. Предварительно данные КМСС-2 подвергались уточненной геопривязке с использованием модифицированного алгоритма SIFT (scale-invariant feature transform), где в качестве опорных данных использовались годовые композитные изображения Sentinel-2 в ближнем ИК-диапазоне.
Таким образом, для зон перекрытия данных двух спутниковых систем создавалась тематическая маска, аналогичная агрегированному продукту SCL, но по данным КМСС-2. Качество полученного продукта оценивалось с помощью вышеописанного метода на основе аналогичных текстурных признаков.
В результате автоматической обработки сотен пар сцен Sentinel-2 и КМСС-2 за различные сезоны 2021 года, охватывающих зерновой пояс России, были отобраны участки с наиболее качественными масками. На их основе сформирован набор данных, использованный для обучения сверточных нейронных сетей архитектур U-Net, Attention U-Net и Attention ResU-Net.
Таким образом, в рамках работы создан метод независимой автоматической оценки качества тематического продукта SCL и перенесенной маски по данным КМСС-2 на основе текстурных признаков GLCM. Ключевым преимуществом метода является возможность построения информативных метрик на основе шести наиболее значимых признаков, вычисляемых всего по двум спектральным каналам, что обеспечивает простоту переноса метода на другие системы ДЗЗ. Автоматизированным способом создана обучающая разметка высокого тематического качества для классов «чистая поверхность», «тень», «вода» и «облачность» по данным КМСС-2 и обучены модели сверточных нейронных сетей семейства U-Net.
Исследование выполнено при поддержке Министерства науки и высшего образования Российской Федерации (соглашение № 075-15-2024-663, уникальный идентификатор 13.2251.21.0264) с использованием ресурсов ЦКП "ИКИ-Мониторинг".
Ключевые слова: Sentinel-2, MSI, Метеор-М, КМСС-2, SCL, текстурные признаки, машинное обучение, сверточные нейронные сети, GLCM
Литература:
- Ёлкина Е.С., Плотников Д.Е., Дунаева Е.А. Обнаружение возможности дистанционного распознавания орошаемых земель Республики Крым на основе спектрально-временных и температурных признаков // Современные проблемы дистанционного зондирования Земли из космоса. 2024. Т. 21. № 5. С. 379-386. DOI: 10.21046/2070-7401-2024-21-5-379-386.
- Haralick R.M., Shanmugam K., Dinstein I. Textural Features for Image Classification // IEEE Transactions on Systems, Man, and Cybernetics. 1973. Vol. SMC-3, no. 6. P. 610–621.
- Hermosilla T., Wulder M.A., White J. C., Coops N.C.,Land cover classification in an era of big and open data: Optimizing localized implementation and training data selection to improve mapping outcomes // Remote Sensing of Environment, Volume 268,2022,112780,ISSN 0034-4257,https://doi.org/10.1016/j.rse.2021.112780.
- Matyukira C., Mhangara P. Advances in vegetation mapping through remote sensing and machine learning techniques: a scientometric review. European Journal of Remote Sensing, 2024, 57(1). https://doi.org/10.1080/22797254.2024.2422330.
- Плотников Д.Е., Хвостиков С.А., Барталев С.А. Метод автоматического распознавания сельскохозяйственных культур на основе спутниковых данных и имитационной модели развития растений // Современные проблемы дистанционного зондирования Земли из космоса. 2018. Т. 15. № 4. С. 131-141. DOI: 10.21046/2070-7401-2018-15-4-131-141.
- Plotnikov D., Kolbudaev P., Matveev A., Loupian E., Proshin A. Daily surface reflectance reconstruction using LOWESS on the example of various satellite systems // IEEE proceedings of ITNT 2022. VIIIth International Conference on Information Technology and Nanotechnology. IEEE, 2022. P. 9848630.
- Sentinel-2 User Handbook. ESA Standard Document. 2015. URL: https://sentinels.copernicus.eu/documents/247904/685211/Sentinel-2_User_Handbook.
- Середа И.И., Денисов П.В., Трошко К.А., Лупян Е.А., Плотников Д.Е., Толпин В.А. Уникальные условия развития озимых культур, наблюдаемые по данным спутникового мониторинга на европейской территории России в октябре 2020 г. // Современные проблемы дистанционного зондирования Земли из космоса. 2020. Т. 17. № 5. С. 304-310. DOI: 10.21046/2070-7401-2020-17-5-304-310.
- Лупян Е.А., Барталев С.А., Крашенинникова Ю.С., Плотников Д.Е., Толпин В.А., Уваров И.А. Анализ развития озимых культур в южных регионах европейской части России весной 2018 года на основе данных дистанционного мониторинга // Современные проблемы дистанционного зондирования Земли из космоса. 2018. Т. 15. № 2. С. 275-281. DOI: 10.21046/2070-7401-2018-15-2-272-276.
- Дунаева Е.А., Плотников Д.Е., Хвостиков С.А., Ёлкина Е.С., Барботкина Е.С., Вечерков В.В., Барталев С.А. Использование данных дистанционного зондирования для ранней диагностики наступления засушливых условий // Таврический вестник аграрной науки. 2019. № 4 (20). С. 28-45.DOI: 10.33952/2542-0720-2019-4-20-28-45.
- Страшная А.И., Барталев С.А., Максименкова Т.А., Чуб О.В., Толпин В.А., Плотников Д.Е., Богомолова Н.А. Агрометеорологическая оценка состояния озимых зерновых культур в период прекращения вегетации с использованием наземных и спутниковых данных на примере Приволжского федерального округа // Труды Гидрометеорологического научно-исследовательского центра Российской Федерации. 2014. № 351. С. 85-107.
- Шабанов Н.В., Барталев С.А., Ерошенко Ф.В., Плотников Д.Е. Развитие возможностей дистанционной оценки индекса листовой поверхности по данным MODIS // Современные проблемы дистанционного зондирования Земли из космоса. 2018. Т. 15. № 4. С. 166-180.DOI: 10.21046/2070-7401-2018-15-4-166-178.
- Плотников Д.Е., Чжоу Ц., Колбудаев П.А., Лупян Е.А., Матвеев А.М., Зимин М.В., Жуков Б.С., Кондратьева Т.В., Лебедев С.В. Разработка и оценка индекса листовой поверхности LAI растительного покрова России на основе разноугловых наблюдений КМСС (Метеор-М) и нейросетевой инверсии модели PROSAIL // Компьютерная оптика. 2025. Т. 49. № 3. С. 504-516. DOI: 10.18287/2412-6179-CO-1621.
- Плотников Д.Е., Колбудаев П.А., Ёлкина Е.С., Дунаева Е.А. Спутниковая оценка ретроспективной даты сева яровых культур на основе нейросетевой модели и рядов данных высокого временного разрешения прибора КМСС // Современные проблемы дистанционного зондирования Земли из космоса. 2025. Т. 22. № 5. С. 114-125. DOI: 10.21046/2070-7401-2025-22-5-114-125.
- Plotnikov D.E., Kolbudaev P.A., Matveev A.M., Proshin A.A., Polyanskiy I.V. Accuracy Assessment of Atmospheric Correction of KMSS-2 Meteor-M #2.2 Data over Northern Eurasia // Remote sensing. 2023. Vol. 15. Issue 18. P. 4395. DOI: doi.org/10.339
- Kolbudaev P.A., Plotnikov D.E., Loupian E.A., Proshin A.A., Matveev A.M. The methods and automatic technology aimed at imagery georeferencing, cloud screening, atmospheric and radiometric correction of KMSS-M satellite data // E3S Web of Conferences, 2021. 333. P. 01006. DOI: doi.org/10.1051/e3sconf/202133301006.0/rs15184395.
- Плотников Д.Е., Колбудаев П.А., Жуков Б.С., Матвеев А.М., Барталев С.А., Егоров В.А., Кашницкий А.В., Прошин А.А. Публикация коллекции мультиспектральных измерений прибором КМСС-М (КА «Метеор-М» No2) для количественной оценки характеристик земной поверхности // Современные проблемы дистанционного зондирования Земли из космоса. 2020. Т. 17. № 7. С. 276–282. DOI: 10.21046/2070-7401-2020-17-7-276–282.
Презентация доклада
Методы и алгоритмы обработки спутниковых данных
34