Набор данных включает в себя ежемесячные сведения о загрязнении поверхностных водных объектов на территории России за период с 2008 по 2021 гг. Экстремально высокие загрязнения доступны с детализацией до муниципальных образований; высокие загрязнение – с детализацией до субъекта РФ. Эти сведения публикуются в ежемесячных отчетах Росгидромета на официальном сайте в формате docx-файлов. В ходе подготовки этого датасета, данные были собраны из этих файлов и преобразованы в машиночитаемые таблицы в формате панельных данных, а также обогащены дополнительными атрибутами.
Единица наблюдения в датасете — место, в котором зафиксирован случай или случаи высокого или экстремально высокого загрязнения водного объекта за отчетный период (месяц). Данные для каждого наблюдения приведены по следующим атрибутам: регион, населенный пункт, в котором или вблизи которого произошел случай, наименование загрязняющего вещества или другого индикатора загрязнения, концентрация загрязняющего вещества или значение иного индикатора, класс опасности загрязняющего вещества и др.
Набор состоит из двух основных таблиц и одной вспомогательной:
Набор доступен для работы в формате CSV (кодировка: «UTF-8», разделитель: «;»).
Атрибут | Описание | Количество пропусков (NaN) (шт/%) | Единица измерения | ОКЕИ | Формат |
---|---|---|---|---|---|
id | ID наблюдения в рамках набора данных | 0 | integer | ||
period | Последний день отчетного периода (месяца) | 0 | date | ||
subject | Наименование субъекта Российской Федерации, в котором зафиксирован случай загрязнения | 0 | cat | ||
municipality | Наименование муниципального образования Российской Федерации, в котором зафиксирован случай загрязнения | 347 | cat | ||
settlement | Наименование населенного пункта, в котором или вблизи которого произошло загрязнение | 161 | cat | ||
oktmo | Значение кода ОКТМО для населенного пункта. Код ОКТМО населенных пунктов состоит из четырех частей и 11 знаков: 2 знака — «код региона»; 3 знака — «код района/города МО»; 3 знака — «код поселения МО»; 3 знака — «код населенного пункта МО» | 347 | numeric | ||
water_body | Наименование водного объекта, в котором зафиксировано загрязнение Например, «вдхр. Аргазинское», «оз. Большое Островное», «р. Колос-Йоки» | 0 | cat | ||
indicator | Загрязняющее вещество, по которому превышен ПДК, или иной показатель, значение которого не соответствует нормативу, что характеризует ситуацию как экстремально высокое загрязнение. Например, «Аммоний-ион», «Взвешенные вещества», «БПК5», «Водородный показатель (pH)» | 0 | cat | ||
hazard_class | Класс опасности загрязняющего вещества: 1-й класс — чрезвычайно опасные; 2-й класс — высоко опасные; 3-й класс — опасные; 4-й класс — умеренно опасные; 4-й Э — «экологический» подкласс 4 класса. Для иных индикаторов, которые не являются загрязняющими веществами (например, запах, БПК5 или pH), класс опасности не указан, так как не имеет смысла | 2538 | cat | ||
cnt_cases | Количество случаев загрязнения, зафиксированных в данном месте в данном месяце | 0 | integer | ||
value_min | Минимальная измеренная концентрация загрязняющего вещества или минимальное зафиксированное значение иного индикатора из всех случаев, зафиксированных в данном месте в данное время | 1 | numeric | ||
value_max | Максимальная измеренная концентрация загрязняющего вещества или максимальное зафиксированное значение иного индикатора из всех случаев, зафиксированных в данном месте в данное время | 1 | numeric | ||
unit | Единица измерения значения, указанного в полях value_min, value_max: ПДК — число раз, в которое зафиксированная концентрация загрязняющего вещества превышает его ПДК, действующий в данном месяце данного года. Иначе говоря, это частное от деления измеренной концентрации загрязняющего вещества на его ПДК; мг/л — миллиграммы на литр; pH — единицы pH; балл — условная характеристика интенсивности запаха | 0 | cat |
Атрибут | Описание | Количество пропусков (NaN) (шт/%) | Единица измерения | ОКЕИ | Формат |
---|---|---|---|---|---|
ingredient | Название загрязняющего вещества (нормализованное) | 0 | text | ||
ingredient_npa | Название загрязняющего вещества (исходное из нормативно-правового акта) | 0 | text | ||
hazard_class | Класс опасности загрязняющего вещества: 1-й класс — чрезвычайно опасные; 2-й класс — высоко опасные; 3-й класс — опасные; 4-й класс — умеренно опасные; 4-й Э — «экологический» подкласс 4 класса | 1 | cat | ||
value | Предельно допустимая концентрация (ПДК) | 0 | numeric | ||
lpv | Лимитирующий показатель вредности (ЛПВ): токc — токсикологический (прямое токсическое действие веществ на водные биологические ресурсы); сан-токс — санитарно-токсикологический (действие вещества на водные биологические ресурсы и санитарные показатели водных объектов рыбохозяйственного значения); общ — общесанитарный; орг — органолептический (образование пленок и пены на поверхности воды водных объектов рыбохозяйственного значения, появление посторонних привкусов и запахов в воде водных объектов рыбохозяйственного значения, выпадение осадка, появление опалесценции, мутности и взвешенных веществ, изменение цвета воды водных объектов). При этом указывается расшифровка характера изменения органолептических свойств воды водных объектов рыбохозяйственного значения: рыб-хоз — рыбохозяйственный (изменение товарных качеств видов водных биологических ресурсов, отнесенных к объектам промышленного и прибрежного рыболовства: появление неприятных и посторонних привкусов и запахов); зап. — изменяет запах воды; мутн. — у... | 0 | cat | ||
formula | Формула вещества | 26 | text | ||
n_cas | Регистрационный номер CAS | 97 | text | ||
npa | Сокращенное название нормативно-правового акта (НПА), из которого взята информация | 0 | cat | ||
date_start | Дата начала действия нормативно-правового акта, указанного в поле npa | 0 | date | ||
date_end | Дата завершения действия нормативно-правового акта, указанного в поле npa | 0 | date |
Атрибут | Описание | Количество пропусков (NaN) (шт/%) | Единица измерения | ОКЕИ | Формат |
---|---|---|---|---|---|
id | ID наблюдения в рамках набора данных | 0 | integer | ||
period | Последний день отчетного периода (месяца) | 0 | date | ||
okato | Код ОКАТО субъекта Российской Федерации, в котором произошло загрязнение | 0 | integer | ||
subject | Наименование субъекта Российской Федерации, в котором произошло загрязнение | 0 | cat | ||
river_basin | Название крупной реки, в речном бассейне которой зафиксировано загрязнение, либо указание на то, что загрязнение произошло в малой реке, озере, водохранилище или морской акватории. Например, «р. Амур», «малые реки, озера, водохранилища» и др. | 0 | cat | ||
indicator | Загрязняющее вещество, по которому превышен ПДК, или иной показатель, значение которого не соответствует нормативу, что характеризует ситуацию как высокое загрязнение. Например, «Аммоний-ион», «Взвешенные вещества», «БПК5», «Водородный показатель (pH)» | 0 | cat | ||
hazard_class | Класс опасности загрязняющего вещества: 1-й класс — чрезвычайно опасные; 2-й класс — высоко опасные; 3-й класс — опасные; 4-й класс — умеренно опасные; 4-й Э — «экологический» подкласс 4 класса. Для иных индикаторов, которые не являются загрязняющими веществами (например, запах, БПК5 или pH), класс опасности не указан, так как не имеет смысла | 3303 | cat | ||
cnt_cases | Количество случаев загрязнения, зафиксированных в данном месте в данном месяце | 0 | integer | ||
value_min | Минимальная измеренная концентрация загрязняющего вещества или минимальное зафиксированное значение иного индикатора из всех случаев, зафиксированных в данном месте в данное время | 0 | numeric | ||
value_max | Максимальная измеренная концентрация загрязняющего вещества или максимальное зафиксированное значение иного индикатора из всех случаев, зафиксированных в данном месте в данное время | 0 | numeric | ||
unit | Единица измерения значения, указанного в полях value_min, value_max: ПДК — число раз, в которое зафиксированная концентрация загрязняющего вещества превышает его ПДК, действующий в данный месяц данного года. Иначе говоря, это частное от деления измеренной концентрации загрязняющего вещества на его ПДК; мг/л — миллиграммы на литр; pH — единицы pH | 0 | cat |
В случае если сопоставить данные не удалось, наименование бралось из первоисточника с приведением формата к близкому к эталонному (например, с помощью удаления лишних пробелов). По некоторым наблюдениям не удалось восстановить код ОКТМО. Это связано с тем, что в первоисточнике есть населенные пункты, находящиеся в разных муниципальных образованиях, но на территории одного субъекта, и поскольку в наборе нет указания на муниципальное образование, возникает неоднозначность в идентификации принадлежности населенного пункта.
Река, пункт |
Регион |
Ингредиент |
Концентрация (ПДК) |
р. Вязьма, г. Вязьма |
Смоленская область |
Кислород |
0,2, 20 случаев |
р. Омь, г. Омск |
Омская область |
Кислород, 4 случая |
1,78; 2 по 0,93 и 0,46 |
р. Чапаевка, г. Чапаевск |
Самарская область |
Гексахлорциклогексан (ГХЦГ), 6 случаев |
5—10 |
В первой ситуации строки разбивались на 20 наблюдений, значение 0,2 относилось и в value_min, и в value_max, при этом cnt_cases у каждого наблюдения заполнялось «1», т.е. один случай.
Во второй ситуации строки разбивались на 4 наблюдения; в первом из них value_min и value_max заполнялись значением 1,78, во втором и третьем — значением 0,93, в четвертом — 0,46; при этом cnt_cases у каждого наблюдения заполнялось «1», т.е. один случай.
Третья ситуация, поскольку в ней количество значений не совпадает с количеством случаев, оставлено одной строкой, при этом cnt_cases заполнялась значением «6», а value_min и value_max значениями «5» и «10» соответственно.
В наблюдениях, где зафиксирован единичный случай (таких подавляющее большинство), cnt_cases заполнялся значением «1», концентрация записывалась и в value_min, и в value_max. Как следствие, если cnt_cases равняется 1, то value_min = value_max.
Читайте предложенные варианты для применения данного датасета на нашей wiki-странице
Полное наименование источника данных |
Ежемесячные отчеты Росгидромета об аварийном, экстремально высоком и высоком загрязнении окружающей среды, а также радиационной обстановке на территории России |
Владелец источника данных |
Федеральная служба по гидрометеорологии и мониторингу окружающей среды |
Краткое описание источника данных |
Отчеты размещены на официальном сайте Росгидромета. Отчет представляет собой один или несколько файлов в формате docx. В каждом отчете есть текстовая информация и таблицы. Среди таблиц есть одна с перечнем случаев экстремально высокого загрязнения поверхностных вод и одна с перечнем случаев высокого загрязнения поверхностных вод |
Ссылка на источник данных |
|
Понятия, используемые в источнике |
Высокое загрязнение (ВЗ) — состояние воды в водном объекте, соответствующее любому из следующих критериев: · максимальное разовое содержание для нормируемых веществ 1—2-й класса опасности в концентрациях, превышающих ПДК от 3 до 5 раз, для веществ 3—4-й класса опасности — от 10 до 50 раз (для нефтепродуктов, фенолов, соединений меди, железа и марганца — от 30 до 50 раз); · величина биохимического потребления кислорода (БПК5) от 10 до 40 мг/л; · снижение концентрации растворенного кислорода до значений от 3 до 2 мг/л; · покрытие пленкой (нефтяной, масляной или другого происхождения) от 1/4 до 1/3 поверхности водного объекта при его обозримой площади до 6 кв. км; · покрытие пленкой поверхности водного объекта на площади от 1 до 2 кв. км при его обозримой площади более 6 кв. км. Экстремально высокое загрязнение (ЭВЗ) — состояние воды в водном объекте, соответствующее любому из следующих критериев: · максимальное разовое содержание для нормируемых веществ 1—2-й класса опасности в концентрациях, превышающих ПДК в 5 и более раз, для веществ 3—4-й класса опасности — в 50 и более раз; · увеличение биохимического потребления кислорода (БКП5) свыше 40 мг/л; · снижение содержания растворенного кислорода до значения 2 мг/л и менее; · покрытие пленкой (нефтяной, масляной или другого происхождения) более 1/3 поверхности водного объекта при его обозримой площади до 6 кв. км; · покрытие пленкой поверхности водного объекта на площади 2 и более кв. км при его обозримой площади более 6 кв. км; · появление запаха вод интенсивностью более 4-х баллов и не свойственного воде ранее; · массовая гибель моллюсков, раков, лягушек, рыб, других водных организмов и водной растительности. Предельно допустимая концентрация (ПДК) — максимальная концентрация вредного вещества, при которой в водном объекте не возникает последствий, снижающих его рыбохозяйственную ценность или возможность использования для хозяйственно-питьевых целей. Можно выделить две разновидности ПДК: рыбохозяйственные и санитарно-гигиенические. Первые устанавливаются для водных объектов рыбохозяйственного значения, вторые — для водных объектов хозяйственно-питьевого и культурно-бытового назначения. Если для одного и того же вещества установлены разные ПДК, то при мониторинге окружающей среды используется наиболее «жесткое», то есть наименьшее, значение. Класс опасности — условная величина, характеризующая вредное воздействие вещества на здоровье человека или экологические системы. Есть четыре класса опасности: ● 1-й класс — чрезвычайно опасные вещества; ● 2-й класс — высоко опасные; ● 3-й класс — опасные; ● 4-й класс — умеренно опасные. Кроме того, при мониторинге окружающей среды в четвертом классе выделяют «экологический» подкласс 4-э. Он означает, что действие вещества проявляются в изменении экологических условий в водоеме. Лимитирующий признак вредности в воде — признак, характеризующийся наименьшей безвредной концентрацией вещества в воде |
Методология и изменения методологии для источника данных |
Порядок представления информации об аварийных выбросах вредных веществ установлен в Приказе Росгидромета от 31.10.2000 № 156 «О введении в действие Порядка подготовки и представления информации общего назначения о загрязнении окружающей природной среды» |
Ссылки на методологию |
Спасибо!
Скачивание началось. Если загрузка
не произошла, нажмите на ссылку
Подтвердите номер телефона, чтобы скачать этот набор данных
На указанный номер телефона поступит звонок, 4 последние цифры которого нужно будет ввести в поле кода подтверждения. Поднимать трубку не нужно.
Введите последние 4 цифры номера входящего звонка
Указанный вами номер +7 (999) 888-77-66
Изменить номер
Повторный звонок с кодом подтверждения можно запросить через: 02:00
Если письмо не приходит в течение 10 минут:
1. Проверьте папку спам
2. Проверьте папку Промоакции
3. Возможно вы ввели адрес с ошибкой, попробуйте еще раз
Заполните данные профиля, чтобы продолжить пользоваться платформой
Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»
1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта «Инфраструктура научно-исследовательских данных» по адресу https://data.rcsi.science (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.
2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.
3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».
4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».
5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.
6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.
7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А
8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.
9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.
10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте https://data.rcsi.science - нажатие мною на элемент с текстом «Я согласен / согласна».
Обратная связь