Методология
Как мы собираем, фильтруем и публикуем данные.
Приёмка данных
Станции передают показания по MQTT или HTTP POST раз в 10 минут. Каждое сообщение подписано ключом станции — анонимные данные не принимаются.
После приёма сырые показания попадают в очередь на валидацию и не публикуются мгновенно — обычно задержка составляет 3-5 минут.
Валидация
Каждое наблюдение проходит несколько проверок:
- Физические пределы: температура в диапазоне -70 до +60°C, давление 500-1100 гПа
- Отклонение от соседних станций в радиусе 50 км (по температуре)
- Отклонение от предыдущего показания той же станции (контроль резких скачков)
- Сверка с данными ERA5 в реанализе задним числом раз в неделю
Точки, не прошедшие проверку, помечаются флагом quality=suspect и в публичном API по умолчанию не возвращаются, но доступны при запросе с параметром ?include_suspect=1.
Калибровка
Мы не можем гарантировать метрологическую точность любительских станций — сенсоры бывают разной категории. Но для относительных трендов и сравнения с соседними точками этого достаточно.
Раз в сезон мы публикуем таблицу систематических смещений для каждой станции относительно ближайшей метеостанции Росгидромета (где она есть).
Доступ к истории
Данные за всё время работы проекта (с 2014 года) доступны через API без ограничений по глубине. Архив хранится в формате Parquet с партиционированием по месяцам и регионам.