Набор данных содержит сведения о веб-страницах в структуре сайта Росстата (rosstat.gov.ru) и их содержимое на 25 сентября 2020 года в виде графа. В наборе хранятся данные о 104711 наблюдениях по 14 атрибутам.
Граф сайта Росстата обеспечивает охват всех веб-страниц, на которые можно попасть, навигируясь по сайту. Он освобождает пользователя от необходимости знать порядок переходов по ссылкам, чтобы попасть на тот или иной узел. Организация графа в виде реляционной базы позволяет использовать средства и методы баз данных для доступа к информации.
Атрибут | Описание | Количество пропусков (NaN) (шт/%) | Единица измерения | ОКЕИ | Формат |
---|---|---|---|---|---|
id | уникальный идентификатор узла в графе сайта rosstat.gov.ru | 0 | bigint | ||
rootname | наименование корневого узла | 0 | varchar | ||
level | уровень графа, т.е. удаленность веб-страницы от корневого узла, выраженная в количестве переходов по гиперссылкам | 0 | integer | ||
name | заголовок веб-страницы | 0 | text | ||
path | абсолютный URL-адрес веб-страницы | 0 | text | ||
redirect | URL-адрес, с которого произошло перенаправление | 0 | text | ||
parent | URL-адрес родительского узла | 0 | text | ||
document | HTML-код веб-страницы в узле | 0 | text | ||
file | содержимое документа в узле в двоичном коде | 0 | bytea | ||
type | формат документа в узле в виде MIME-типа | 0 | varchar | ||
done | техническое поле с отметкой о пересборе узла | 0 | bool | ||
hash | хэш-функция содержимого узла | 0 | varchar | ||
href | значение атрибута <href> гиперссылки, по которой осуществляется переход на узел | 0 | text | ||
timestamp | время сбора узла графа | 0 | timestamp |
Данные опубликованы в том виде, в котором они представлены в первоисточнике. Изменения не вносились.
Спасибо!
Скачивание началось. Если загрузка
не произошла, нажмите на ссылку
Подтвердите номер телефона, чтобы скачать этот набор данных
На указанный номер телефона поступит звонок, 4 последние цифры которого нужно будет ввести в поле кода подтверждения. Поднимать трубку не нужно.
Введите последние 4 цифры номера входящего звонка
Указанный вами номер +7 (999) 888-77-66
Изменить номер
Повторный звонок с кодом подтверждения можно запросить через: 02:00
Если письмо не приходит в течение 10 минут:
1. Проверьте папку спам
2. Проверьте папку Промоакции
3. Возможно вы ввели адрес с ошибкой, попробуйте еще раз
Заполните данные профиля, чтобы продолжить пользоваться платформой
Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»
1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта «Инфраструктура научно-исследовательских данных» по адресу https://data.rcsi.science (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.
2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.
3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».
4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».
5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.
6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.
7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А
8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.
9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.
10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте https://data.rcsi.science - нажатие мною на элемент с текстом «Я согласен / согласна».
Обратная связь