Материалы 17-й Всероссийской открытой конференции «Современные проблемы дистанционного зондирования Земли из космоса», Москва, ИКИ РАН, 2019 год
Унифицированная технология организации блочного доступа к данным в архивах для проведения их эффективной распределенной параллельной обработки
Прошин А.А. (1), Лупян Е.А. (1), Бурцев М.А. (1), Кашницкий А.В. (1), Кобец Д.А. (1), Матвеев А.М. (1)
(1) Институт космических исследований РАН, Москва, Россия
Стремительное развитие спутниковых систем дистанционного зондирования Земли привело к практически экспоненциальному росту поступающих в архивы спутниковых данных [1]. Появляются совершенно новые приборы наблюдения, повышается качество получаемых с них данных, что позволяет использовать их для достаточно точной оценки тех или иных физических характеристик. Все это приводит к существенному расширению области применения данных ДЗЗ, и как следствие, к резкому возрастанию как числа различных задач по обработке спутниковых данных, так и объемов обрабатываемой информации. В результате задачи оптимизации всех процедур, связанных с обработкой спутниковых данных, приобретают все большую важность.
Доклад посвящен разрабатываемой в настоящее время в ИКИ РАН унифицированной технологии организации блочного доступа к данным в архивах для проведения их эффективной распределенной параллельной обработки. Основными целями ее создания являются максимальная унификация и оптимизация всех процедур подготовки данных для обработки. Актуальность этой задачи во многом связана с тем, что спутниковые данные в архивах, как правило, хранятся в формате GeoTIFF в виде отдельных фрагментов (тайлов), что позволяет в каждом конкретном случае использовать только те тайлы, которые необходимы. Поэтому использование прямого блочного доступа к таким файлам зачастую позволяет существенно сократить время чтения данных и, таким образом, ускорить процедуры обработки и визуализации данных. В свою очередь, для эффективной обработки спутниковых данных по большим областям (например, по территории России), целесообразно использовать разбиение исходных данных на фрагменты по регулярной сетке и обрабатывать их в параллельном режиме на множестве серверов обработки. Таким образом, основной задачей рассматриваемой технологии является максимально быстрое формирование исходных данных по заданному фрагменту разбиения.
В докладе приводятся краткие сведения о реализации сверхбольших архивов разнородных спутниковых данных ЦКП «ИКИ-Мониторинг» [2], построенных по разработанной в ИКИ РАН технологии UNISAT [3], а также о технологии организации распределенной многопотоковой обработки спутниковых данных [4], также разработанной в ИКИ РАН. Рассматривается реализованная до недавнего времени схема обеспечения доступа к данным для проведения их обработки. Затем приводится функциональная схема, соответствующая новому подходу к решению этой задачи. В рамках этой схемы, наряду с использованием исключительно только блочного доступа к файлам данных, факторами оптимизации также являются использование вычислительных ресурсов самих серверов хранения данных для предварительной подготовки данных, а также запрос данных для обработки с разных серверов хранения в параллельном режиме. Также реализуется режим, когда необходимые наборы данных единообразным образом формируются на серверах обработки на основе прямого блочного доступа к серверам хранения, что для некоторых типов обработки является предпочтительным. Существенным преимуществом новой подсистемы является также унификация процедур подготовки данных для проведения обработки. Таким образом, предложенный подход позволяет существенно сократить издержки, связанные с операциями чтения данных, а также значительно упростить разработку и внедрение новых типов обработки.
Работа выполнена в рамках темы "Большие данные в космических исследованиях: астрофизика, солнечная система, геосфера" (госрегистрация №0024-2019-0014), c использованием ресурсов ЦКП «ИКИ-Мониторинг» [2, 5]
Ключевые слова: Обработка спутниковых данных, архивы спутниковых данных, большие данные, ЦКП "ИКИ-Мониторинг"Литература:
- Лупян Е.А., Бурцев М.А., Прошин А.А., Кобец Д.А. Развитие подходов к построению информационных систем дистанционного мониторинга // Современные проблемы дистанционного зондирования Земли из космоса. 2018. Т. 15. № 3. С. 53-66. DOI: DOI: 10.21046/2070-7401-2018-15-3-53-66.
- Лупян Е.А., Прошин А.А., Бурцев М.А., Кашницкий А.В., Балашов И.В., Барталев С.А., Константинова А.М., Кобец Д.А., Мазуров А.А., Марченков В.В., Матвеев А.М., Радченко М.В., Сычугов И.Г., Толпин В.А., Уваров И.А. Опыт эксплуатации и развития центра коллективного пользования системами архивации, обработки и анализа спутниковых данных (ЦКП «ИКИ-Мониторинг») // Современные проблемы дистанционного зондирования Земли из космоса. 2019. Т. 16. № 3. С. 151-170. DOI: 10.21046/2070-7401-2019-16-3-151-170.
- Прошин А.А., Лупян Е.А., Балашов И.В., Кашницкий А.В., Бурцев М.А. Создание унифицированной системы ведения архивов спутниковых данных, предназначенной для построения современных систем дистанционного мониторинга // Современные проблемы дистанционного зондирования Земли из космоса. 2016. Т. 13. № 3. С. 9-27. DOI: 10.21046/2070-7401-2016-13-3-9-27.
- Кобец Д.А., Матвеев А.М., Мазуров А.А., Прошин А.А. Организация автоматизированной многопотоковой обработки спутниковой информации в системах дистанционного мониторинга // Современные проблемы дистанционного зондирования Земли из космоса. 2015. Т. 12. № 1. С. 145–155.
- Лупян Е.А., Прошин А.А., Бурцев М.А., Балашов И.В., Барталев С.А., Ефремов В.Ю., Кашницкий А.В., Мазуров А.А., Матвеев А.М., Суднева О.А., Сычугов И.Г., Толпин В.А., Уваров И.А. Центр коллективного пользования системами архивации, обработки и анализа спутниковых данных ИКИ РАН для решения задач изучения и мониторинга окружающей среды // Современные проблемы дистанционного зондирования Земли из космоса. 2015. Т.12. № 5. С.263-284.
Презентация доклада
Технологии и методы использования спутниковых данных в системах мониторинга
118