Двадцать вторая международная конференция "СОВРЕМЕННЫЕ ПРОБЛЕМЫ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ ИЗ КОСМОСА"
XXII.A.164
Семантическая сегментация поврежденных деревьев пихты сибирской на зашумленных снимках с беспилотных летательных аппаратов
Малкин А.Ю. (1), Марков Н.Г. (1)
(1) Национальный исследовательский Томский политехнический университет, Томск, Россия
Вспышки массового распространения стволовых вредителей наносят непоправимый вред хвойным лесам во многих странах мира. Так, сегодня в России известным и опасным вредителем пихтовых лесов является уссурийский полиграф Polygraphus proximus. Для выявления очагов размножения таких вредителей и оценки степени повреждения ими хвойных деревьев необходим оперативный мониторинг лесов, который сегодня все чаще проводят с использованием методов и средств дистанционного зондирования Земли. Съемка лесов ведется с помощью космических аппаратов и беспилотных летательных аппаратов (БПЛА), оснащённых фото- или видеокамерами высокого разрешения. Все чаще начинают использовать современные модели и методы глубокого обучения, позволяющие решать с довольно высокой точностью задачу семантической сегментации (попиксельной классификации) полученных снимков хвойных лесов. Цель данной работы – исследовать качество сегментации поврежденных уссурийским полиграфом деревьев пихты сибирской на зашумленных импульсными помехами снимках с БПЛА. При этом сегментация снимков выполняется с помощью разработанной модифицированной сверточной нейронной сети U-Net, обучаемой с разными функциями потерь. Оценка качества сегментации проводится с помощью метрики mIoU, которая вычисляется как среднее метрик IoU для каждого из четырех классов состояния здоровья деревьев пихты и фона.
Для обучения и исследования устойчивости к таким помехам модифицированной модели U-Net созданы по исходным RGB-снимкам с БПЛА пораженных пихтовых насаждений три выборки: обучающая (2004 фрагмента размером 256х256 пикселей), валидационная (672 фрагмента) и тестовая (91 фрагмент). Причем модель обучалась как с традиционной функцией потерь Focal Loss, так и с робастной функцией потерь Коши. Моделирование зашумления фрагментов любой из выборок импульсными помехами осуществлялось путем увеличения амплитуды яркости каждого зашумляемого пикселя относительно исходной амплитуды пикселя в 1,5, 2,0 и 3,0 раза, а площадь зашумления фрагмента составляла от 10% до 50% от его площади. Проведены две серии экспериментов: первая с модифицированной моделью U-Net, использующей функцию потерь Focal Loss, а вторая – с этой же моделью, но с робастной функцией потерь Коши.
В результате исследований показано, что качество сегментации деревьев пихты падает с ростом площади зашумления и амплитуды помех на фрагментах обучающей выборки, а степень падения качества сегментации зависит от используемой при обучении модели U-Net функции потерь. При этом для максимальных задаваемых значений амплитуды помех и площади зашумления фрагментов устойчивость модели к помехам выше при использовании робастной функции Коши. Зашумление фрагментов только валидационной выборки приводит к незначительному падению качества сегментации по сравнению с вариантами зашумления фрагментов только обучающей или тестовой выборок. В варианте зашумления фрагментов и обучающей, и тестовой выборок происходит более заметное ухудшение качества сегментации, а при зашумлении фрагментов всех выборок качество сегментации поврежденных деревьев пихты на снимках оказалось на практически неприемлемом уровне (метрика mIoU меньше 0,5).
Ключевые слова: Семантическая сегментация деревьев пихты сибирской на снимках с беспилотного летательного аппарата, устойчивость модифицированной модели U-Net к помехам
Методы и алгоритмы обработки спутниковых данных