Материалы 17-й Всероссийской открытой конференции «Современные проблемы дистанционного зондирования Земли из космоса», Москва, ИКИ РАН, 2019 год
Исследование возможности использования методов машинного обучения для автоматической классификации треков спутникового позиционирования на примере системы мониторинга рыболовства
Дегай А.Ю. (1), Пырков В.Н. (1), Василец П.М. (1), Андреев М.В. (1)
(1) Институт космических исследований РАН, Москва, Россия
В работах (Василец и др., 2017), (Василец и др., 2018) показана важность и эффективность классификации треков для определения достоверности отчетов о вылове в отраслевой системе мониторинга рыболовства (ОСМ). В работах (Пырков и др., 2018), (Белоконь и др., 2019) показано, что повышение точности автоматической классификации необходимо для проведения корректного сопоставления спутниковых позиционных данных и отчетности пользователей ОСМ.
В данном докладе рассматривается возможность применения методов машинного обучения для классификации треков судов по спутниковым позиционным данным.
Для применения методов машинного обучения необходимо подготовить значительный объем данных для обучения и проверки. В первую очередь были выбраны только такие треки судов, которые находятся на значительном расстоянии (не менее пятидесяти километров) от портов. Среди оставшихся позиций были выделены сутки, в которых у испытуемых судов было более пятидесяти позиций. Данное условие обеспечивало высокую вероятность того, что частота позиционного опроса не менее двух позиций в час. Для первоначальной отработки алгоритма машинного обучения был выбраны суда типа – Большой морозильный траулер (БМРТ) проект 1288 "Пулковский Меридиан", которые проводили добычу-вылов в Охотском море.
В процессе подготовки обучающих данных был сделан вывод о высокой погрешности скорости судна, указываемой в пакете, который приходит на судовые технические средства контроля. Дальнейшие действия по разбиению трека на классы по скорости производились со скоростями, которые определялись по координатам судна.
Среди всего множества позиций выбирались такие фрагменты треков, когда позиции судна в течение одних суток определялись более пятидесяти раз на протяжении более пяти дней (суток) подряд.
В рамках выделенных тестовых треков, используя результаты предварительной классификации по скорости, визуально определялись участки, когда судно осуществляло траление.
Для удобства визуального выделения на диаграмме участков траления, вспомогательная программа выводит от семи до пятнадцати последовательных фрагментов трека относящихся к разным классам по скорости.
Таким образом, в результате визуального выделения фрагментов траления была получена обучающая выборка, содержащая положительных примеров - 10462, отрицательных - 6050.
Были проведены тесты на основе модели классификации базового уровня (baseline model) с помощью алгоритмов случайный лес и бустинг (реализация - библиотека xgb). Оптимизируется метрика accuracy ( Accuracy = (TP+TN)/(TP+TN+FP+FN) where: TP = True positive; FP = False positive; TN = True negative; FN = False negative ).
Для борьбы с переобучением используется метод перекрёстной проверки (cross validation) с разбиением на 3 части.
В зависимости от алгоритма и его параметров результат совпадения составляет 70% - 65%.. Что позволяет говорить о хорошем уровне подготовки обучающей выборки и необходимости провести расширение обучающей выборки с помощью опробованного алгоритма.
Работа выполнена при поддержке Минобрнауки (тема "Мониторинг", госрегистрация № 01.20.0.2.00164), c использованием ресурсов ЦКП «ИКИ-Мониторинг» (Лупян и др., 2015, 2019).
Ключевые слова: алгоритм автоматической классификации треков, отраслевая система мониторинга водных биологических ресурсов, наблюдения и контроля за деятельностью промысловых судов (ОСМ), позиционные спутниковые данные, машинное обучениеЛитература:
- Василец П.М., Терентьев Д.А., Пырков В.Н. Анализ пространственного распределения вылова камбал за 2011 - 2016 годы в прикамчатских и смежных с ними районах по данным отраслевой системы мониторинга Росрыболовства // Исслед. водн. биол. ресурсов Камчатки и сев.-зап. части Тихого океана: Сб. науч. тр. Камчат. НИИ рыб. хоз-ва и океанографии. 2017. Вып. 47. С. 65-76. DOI: 10.15853/2072-8212.2017.47.65-76.
- Василец П.М., Терентьев Д.А., Коробов С.А., Пырков В.Н., Солодилов. А.В., Дегай А.Ю. Возможности оценки достоверности пространственной информации по вылову донных рыб в отраслевой системе мониторинга Росрыболовства на основе комплексного анализа производственно-промысловой отчетности и данных спутникового позиционирования промысловых судов // Современные проблемы дистанционного зондирования Земли из космоса. 2018. Т. 15. № 7. С. 35-42. DOI: 10.21046/2070-7401-2018-15-7-35-42.
- Пырков В.Н., Василец П.М., Дегай А. Ю, Андреев М.В., Черных В.Н., Солодилов А.В. Новый подход к верификации отчетов о вылове на основе классификации треков спутникового позиционирования в системе мониторинга рыболовства // Информационные технологии в дистанционном зондировании Земли - RORSE 2018. ИКИ РАН, 2019. С. 145-149. DOI: 10.21046/rorse2018.145.
- Белоконь З.С., Василец П.М., Дегай А.Ю. , Пырков В.Н. Возможность повышения точности автоматической классификации треков судов в Отраслевой системе мониторинга Росрыболовства с помощью методики выявления периодов сближения судов// XVI всероссийская научно-техническая конференция "Современные методы и средства океанологических исследований" (МСОИ-2019). М.:ИД Академии Жуковского, 2019. Т.I. С. 251-254.
- Лупян Е.А., Прошин А.А., Бурцев М.А., Балашов И.В., Барталев С.А., Ефремов В.Ю., Кашницкий А.В., Мазуров А.А., Матвеев А.М., Суднева О.А., Сычугов И.Г., Толпин В.А., Уваров И.А. Центр коллективного пользования системами архивации, обработки и анализа спутниковых данных ИКИ РАН для решения задач изучения и мониторинга окружающей среды // Современные проблемы дистанционного зондирования Земли из космоса. 2015. Т. 12. № 5. С. 263-284.
- Лупян Е.А., Прошин А.А., Бурцев М.А., Кашницкий А.В., Балашов И.В., Барталев С.А., Константинова А.М., Кобец Д.А., Мазуров А.А., Марченков В.В., Матвеев А.М., Радченко М.В., Сычугов И.Г., Толпин В.А., Уваров И.А. Опыт эксплуатации и развития центра коллективного пользования системами архивации, обработки и анализа спутниковых данных (ЦКП «ИКИ-Мониторинг») // Современные проблемы дистанционного зондирования Земли из космоса. 2019. Т. 16. № 3. С. 151-170.
Презентация доклада
Технологии и методы использования спутниковых данных в системах мониторинга
82