Войти на сайт
МЕЖДУНАРОДНЫЕ ЕЖЕГОДНЫЕ КОНФЕРЕНЦИИ
"СОВРЕМЕННЫЕ ПРОБЛЕМЫ ДИСТАНЦИОННОГО
ЗОНДИРОВАНИЯ ЗЕМЛИ ИЗ КОСМОСА"
(Физические основы, методы и технологии мониторинга окружающей среды, природных и антропогенных объектов)

Девятнадцатая международная конференция «СОВРЕМЕННЫЕ ПРОБЛЕМЫ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ ИЗ КОСМОСА (Физические основы, методы и технологии мониторинга окружающей среды, потенциально опасных явлений и объектов)»

XIX.A.289

Повышение точности детектирования границ карьеров по спутниковым снимкам с использованием нейронной сети глубокого обучения deeplabv3+

Семененко Л.В. (1), Сорока А.М. (1), Шкабара В.В. (1)
(1) Институт прикладных физических проблем имени А.Н.Севченко Белорусского государственного университета, Минск, Республика Беларусь
Для снижения уровня воздействия на окружающую среду при добыче полезных ископаемых открытым способом, необходимо проводить постоянный контроль наличия нарушений границ карьеров. Границы карьеров имеют четко обозначенные допустимые значения, определённые в проектах на добычу полезных ископаемых. Непосредственный контроль инспекторами на местности представляет непростую и достаточно затратную задачу. Существенные преимущества для контроля нарушений границ карьеров может дать автоматизированная обработка их изображений на спутниковых снимках.
Настоящая работа посвящена повышению точности определения границ карьеров при автоматизированном их детектировании по спутниковым снимкам белорусского космического аппарата и российского спутника Конопус-В с помощью нейронных сетей глубокого обучения (далее – НСГО).
Для разработки метода детектирования карьеров за основу взята полносверточная [2] НСГО deeplabv3+. НСГО deeplabv3+ состоит из двух частей: кодер и декодер [3]. В качестве кодера в данной работе используется сверточная НСГО ResNetV2-101 со следующей за ней пространственной пирамидой [4], которая обеспечивает сохранение пространственных признаков для лучшего восстановления изображения и, как следствие, получения более четких границ. Декодер состоит из последовательных слоев повышения дискретизации и слоев свертки, необходимых для корректировки результатов с предыдущих слоев.
Исходными данными для обучения НСГО являются 965 панхроматических изображений карьеров и близлежащих территорий, размеченных с использованием визуального дешифрирования. Данного количества изображений недостаточно для построения надежных признаков в процессе обучения декодера НСГО. В связи с этим используется техника аугментации данных (увеличения набора обучающих данных путем модификации исходных данных). Использовались следующие методы аугментации: горизонтальное и вертикальное отражение, масштабирование, использование части изображения, поворот изображения, наложение полупрозрачного прямоугольника, изменение контраста, эластичная деформация.
Анализ распределения размеров карьеров показывает следующее: 90% размеров изображений карьеров лежит в диапазоне до 200x200 пикселeй, 10% изображений имеют размер больше 200x200 пикселей. Для того, чтобы избежать потерь при масштабировании изображений в размер входа НСГО, который составляет 401x401 пикселей, изображения, размер которых превышает 802x802 пикселей, разделяются на 9 сегментов равных размеров с последующим масштабированием полученных сегментов до размера 401x401 пикселей. Данный подход позволяет улучшить точность решения до 82.87%.
Так же для улучшения точности в процессе обучения каждые 15000 итераций из обучающего набора данных удаляются те примеры, на которых значение функции потерь принимает минимальное значение. Данное изменение улучшает результат до 83.67%.
Использование методов аугментации данных, разделения изображений карьеров на сегменты, а также удаление из обучающего набора легких примеров позволяет достичь итоговой точности решения 83.67%.

Ключевые слова: нейронные сети глубокого обучения, спутниковые снимки, семантическая сегментация, аугментация данных, автоматизированное определение границ карьеров
Литература:
  1. L. Chen, G. Papandreou, I. Kokkinos, K. Murphy and A. L. Yuille, “DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs,” in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 40, no. 4, pp. 834–848, 1 April 2018.
  2. Jonathan Long, Evan Shelhamer, Trevor Darrell Fully Convolutional Networks for Semantic Segmentation / Jonathan Long, Evan Shelhamer, Trevor Darrell // CVPR 2015: 28th IEEE Conference on Computer Vision and Pattern Recognition – Бостон, 2015 – с. 3431–3440.
  3. V. Badrinarayanan, A. Kendall and R. Cipolla, “SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation,” in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 39, no. 12, pp. 2481–2495, 1 Dec. 2017.
  4. Liang-Chieh Chen, Yukun Zhu, George Papandreou, Florian Schroff, Hartwig Adam Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation / Liang-Chieh Chen, Yukun Zhu, George Papandreou, Florian Schroff, Hartwig Adam // ECCV 2018: The European Conference on Computer Vision (ECCV) – Мюнхен, 2018 – с. 801–818.

Презентация доклада

Методы и алгоритмы обработки спутниковых данных

62