Двадцать третья международная конференция "СОВРЕМЕННЫЕ ПРОБЛЕМЫ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ ИЗ КОСМОСА"
XXIII.D.3
Сравнительный анализ методов машинного обучения для прогнозирования суточного хода температуры воздуха степной зоны Северной Евразии
Васильев Д.Ю. (1,2), Семенов В.А. (3,4), Христодуло О.И. (1), Ковальчук В.А. (1)
(1) Уфимский университет науки и технологий, Уфа, Россия
(2) Институт степи Уральского отделения РАН, Оренбург, Россия
(3) Институт физики атмосферы имени А. М. Обухова РАН, Москва, Россия
(4) Институт географии РАН, Москва, Россия
За последние десятилетия в гидрометеорологической практике интенсивно внедряются методы машинного обучения [1-6], которые могут эффективно использоваться вместе с традиционными методами статистического анализа и численных методов прогноза погоды и изменений климата [7-18]. Необходимо отметить, что применение методов машинного обучения обусловлено также постоянно увеличивающимся объемом баз данных гидрометеорологических наблюдений станционных сетей, реанализов, а также дистанционных измерений. Несмотря на большое количество опубликованных работ и многолетний опыт использования методов машинного обучения в гидрометеорологической практике, не существует строго определенных моделей искусственного интеллекта для прогноза погоды. Цель работы – произвести сравнительный анализ методов машинного обучения для прогноза суточного хода температуры и изучить его пространственно-временною специфику на примере степной зоны Северной Евразии.
В работе были использованы архивные данные суточного хода приземной температуры воздуха (Climatic Research Unit–CRU), находящиеся в свободном доступе (https://archive.ceda.ac.uk), за период с 1960 по 2023 гг. На аналогичном временном интервале был произведен корреляционный анализ данных архива CRU с фактическими данными наблюдательной сети Росгидромет (http://meteo.ru/). Для суточного, декадного и месячного прогноза были использованы методы k-ближайших соседей (k-nearest neighbors) и случайного леса (random forests), подробное описание которых изложено в работах [19, 20].
Установлено, что суточный ход температуры воздуха по сезонам в отдельные десятилетия отличается, наблюдается тенденция к небольшому снижению в летние месяцы и увеличению в зимние, что приводит к уменьшению амплитуды сезонных колебаний в последние два десятилетия по сравнению с предыдущими годами. Прогноз методом случайного леса по сравнению с методом k-ближайших соседей более адекватные результаты. При этом, анализ гистограмм ошибок показал, что распределение ошибок в обоих методах центрировано и близкую к нормальному (распределение Гаусса), что является хорошим признаком качества моделей. В целом, обе модели показывают сопоставимую производительность, но random forests, как правило, имеет более высокие метрики R² (коэффициент детерминации), RMSE (среднеквадратическая ошибка) и MAE (средняя абсолютная ошибка), что делает его предпочтительной моделью для данной выборки данных.
Работа выполнена в рамках Государственного задания «Проблемы степного природопользования в условиях современных вызовов: оптимизация взаимодействия природных и социально-экономических систем» (№ АААА-А21-121011190016-1), а также при поддержке гранта РНФ № 24-17-00138 (Экстремальные погодные явления на территории России: механизмы формирования и ожидаемые изменения).
Ключевые слова: приземная температура воздуха, линейные тренды, метод k-ближайшего соседа, метод случайного леса, пространственная интерполяция
Литература:
- Буторова А.С., Сергеев А.П., Шичкин А.В., Буевич А.Г., Баглаева Е.М., Сергеева М.В. Метод встречного прогнозирования пространственного ряда на примере содержания пыли в снеговом покрове // Геоинформатика. 2022. № 1. С. 32-39.
- Быков Ф.Л. Статистическая коррекция прогнозов погоды по модели COSMO с помощью нейронных сетей // Метеорология и гидрология. 2020. № 3. С. 5-20.
- Поляков А.В. Использование метода искусственных нейронных сетей при восстановлении вертикальных профилей атмосферных параметров // Оптика атмосферы и океана. 2014. Т. 27. № 1. С. 34-39.
- Krasnopolsky V. M., Lin Y. A neural network nonlinear multimodel ensemble to improve precipitation forecasts over continental US // Advances in Meteorology. 2012. Article ID 649450. PP. 1-11. DOI: 10.1155/2012/649450
- Marzban C. A neural network for post-processing model output: ARPS // Monthly Weather Review. 2003. V. 131. № 4. PP. 1103- 1111.
- Varentsov M.I., Krinitskiy M.A., Stepanenko V.M. Approximation of spatial and temporal variability of the urban heat island in Moscow using machine learning // Moscow University Physics Bulletin. 2024. V. 79. S2. PP. 784-797.
- Алферов Ю.В., Климова Е.Г. Опыт использования фильтра Калмана для коррекции численного прогноза приземной температуры воздуха // Гидрометеорологические исследования и прогнозы. 2020. № 4. С. 28-42.
- Багров А.Н., Быков Ф.Л., Гордин В.А. Схема оперативного краткосрочного комплексного прогноза приземной температуры и влажности воздуха // Метеорология и гидрология. 2018. № 8. С. 5-18.
- Васильев Д.Ю., Лукманов Р.Л., Ферапонтов Ю.И., Чувыров А.Н. Цикличность гидрометеорологических характеристик на примере Башкирии // Доклады академии наук. 2012. Т. 447. № 3. С. 331-334.
- Васильев Д.Ю., Павлейчик В.М., Семенов В.А., Сивохип Ж.Т., Чибилёв А.А. Многолетний режим температуры воздуха и атмосферных осадков на территории Южного Урала // Доклады академии наук. 2018. Т. 478. № 5. С. 588-592.
- Васильев Д.Ю., Семенов В.А., Чибилев А.А. Климатические изменения температурного режима на территории России в XX – в начале XXI века // География и природные ресурсы. 2023. Т. 44. № 2. С. 15-23.
- Васильев Д.Ю., Ферапонтов Ю.И. Тренды в колебаниях приземной температуры воздуха на примере Башкирии // Известия РАН. Серия географическая. 2015. № 1. С. 77-86.
- Вильфанд Р.М., Емелина С.В., Тищенко В.А., Толстых М.А., Хан В.М. Статистическая коррекция долгосрочных прогнозов приземной температуры воздуха по модели ПЛАВ для территории Северной Евразии // Метеорология и гидрология. 2024. № 5. С. 5-16.
- Зароченцев Г.А., Рубинштейн К.Г., Бычкова В.И., Игнатов Р.Ю., Юсупов Ю.И. Сравнение нескольких численных методов прогноза тумана // Оптика атмосферы и океана. 2018. Т. 31. № 12. С. 981-987.
- Степаненко В.М., Репина И.А., Медведев А.И., Романенко В.А. Воспроизведение моделью LAKE температуры поверхности крупнейших озер Земли: система автоматической калибровки по данным MODIS // Современные проблемы дистанционного зондирования Земли из космоса. 2024. Т. 21. № 6. С. 267-283.
- Толстых М.А., Фролов А.В. Некоторые современные проблемы численного прогноза погоды // Известия РАН. Физика атмосферы и океана. 2005. Т. 41. № 3. С. 315-327.
- Vasil’ev D.Yu., Velmovsky P.V. Analysis of surface air temperature characteristics over the territory of Russia for 1930-2021 // Atmospheric and Oceanic Optics. 2024. V. 37. S1. PP. 72-77. DOI: 10.1134/S102485602470163X
- Wang J., Zhou L., Ma Ch., Sun W. Analyzing the effects of climate change and human activities on streamflow in a North China arid basin: a machine learning perspective considering model structural uncertainty // Theoretical and Applied Climatology. 2025. V. 156. DOI: 10.1007/s00704-025-05352-y
- Huang S., Huang M., Lyu Y. A novel approach for sand liquefaction prediction via local mean-based pseudo nearest neighbor algorithm and its engineering application // Advanced Engineering Informatics. 2019. V. 41. DOI: 10.1016/j.aei.2019.04.008
- Breiman L. Random forests // Machine Learning. 2001. V. 45. PP. 5-32.
Дистанционные методы исследования атмосферных и климатических процессов