Материалы 22-й Международной конференции «Современные проблемы дистанционного зондирования Земли из космоса»
Москва, ИКИ РАН, 11–15 ноября 2024 г.

(http://conf.rse.geosmis.ru)

XXII.A.414

Получение предобученных данных для машинного обучения на базе процедур иерархической бинаризации и агрегации

Рихтер А.А. (1,2,3), Мурынин А.Б. (1,4,3), Филимонов А.А. (1), Харченко В.Д. (1)
(1) НИИ "АЭРОКОСМОС", Москва, РФ
(2) АО «Тазмар АйТи-солюшнз», Санкт-Петербург, РФ
(3) Государственный университет по землеустройству, Москва, РФ
(4) ФИЦ ИУ РАН, Москва, РФ
В работе предлагается способ ускорения подготовки данных для семантической сегментации информативных классов на изображениях [1]-[4]. Данный способ основан на получении модели кластеризации, построенной на базе применения операций иерархической бинаризации и агрегации.
При иерархической бинаризации каждый кластер рекурсивно раскладывается на два кластера с применением неиерархического метода кластеризации. При иерархической агрегации происходит разложение каждого кластера на связные компоненты и рекурсивно объединение компонент, расстояние между которыми не более растущего порогового значения. Каждый объект модели координируется, в зависимости от числа рекурсивных обращений при бинаризации и агрегации.
Данный способ автоматизации получения первичных информативных признаков является составной частью процедуры подготовки данных для машинного обучения.
В отличие от большинства существующих иерархических методов данный упрощённый подход не требует больших затрат потребляемой памяти и позволяет его применять при тайловой обработке, при обработке больших изображений, мультиспектральных и гиперспектральных изображений [5-6].
Разработана база данных спутниковых систем дистанционного зондирования Земли, применяемая для выбора категории спутниковых изображений, релевантных требованиям (пространственного и спектрального разрешения, временных и геометрических характеристик и др.) для получения приемлемого качества модели кластеризации.

Ключевые слова: изображение, кластеризация, иерархическая бинаризация, иерархическая агрегация, предобучение, обучающая выборка, машинное обучение, информативные признаки, база данных
Литература:
  1. Воробьев В. Е., Мурынин А. Б., Рихтер А. А. Выбор методов кластеризации при машинном обучении для исследования экологических объектов по спутниковым данным // Известия РАН. Теория и системы управления. 2024. №5.
  2. Пестунов И.А., Рылов С.А. Метод построения ансамбля сеточных иерархических алгоритмов кластеризации для сегментации спутниковых изображений / В сборнике: Региональные проблемы дистанционного зондирования земли. Материалы международной научной конференции. Сибирский федеральный университет. 2014. С. 215-223.
  3. Никитин О.Р., Кисляков А.Н. Метод иерархической кластеризации цифровых многоспектральных изображений в задачах экологического мониторинга / Радиотехнические и телекоммуникационные системы. 2021. № 4 (44). С. 49-56.
  4. Пестунов И.А., Рылов С.А., Бериков В.Б. Иерархические алгоритмы кластеризации для сегментации мультиспектральных изображений / Автометрия. 2015. Т. 51. № 4. С. 12-22.
  5. Мурынин А.Б., Рихтер А.А. Алгоритмы морфологического анализа векторизованных границ на изображениях / В сборнике тезисов докладов 15-й Международной конференции «Интеллектуализация обработки информации» ИОИ-2024. Гродно, 2024.
  6. Мурынин А. Б., Рихтер А. А., Козуб В. А., Гвоздев О. Г. Модели представления объектов по данным гиперспектральной съёмки // Мехатроника, автоматизация, управление, Москва: Новые технологии, 2023. —Т. 2. — № 1. — С. 5-25.

Презентация доклада



Ссылка для цитирования: Рихтер А.А., Мурынин А.Б., Филимонов А.А., Харченко В.Д. Получение предобученных данных для машинного обучения на базе процедур иерархической бинаризации и агрегации // Материалы 22-й Международной конференции «Современные проблемы дистанционного зондирования Земли из космоса». Москва: ИКИ РАН, 2024. C. 52. DOI 10.21046/22DZZconf-2024a

Методы и алгоритмы обработки спутниковых данных

52