Набор данных создан с использованием технологий машинного обучения, нейронных сетей и содержит аннотации биологических и физико-химических свойств структурных мотивов белков. Аннотация включает параметры для: белка (название белка, название организма, код таксономической группы, биологический процесс и функция белка); структурного мотива белка (тип мотива, цепь в белке, локус и длина, аминокислотная последовательность, физико-химические свойства); эксперимента (источник структуры белка, разрешение структуры, экспериментальный метод и название эксперимента).
Набор данных предназначен для проведения структурного анализа белков, ассоциированных с развитием заболеваний, в том числе аберрантных форм белков, которые образованы вследствие аминокислотных замен, модифицирования после синтеза. Набор данных может применяться для решения прикладных медико-биологических задач, таких как разработка новых подходов к диагностике заболеваний, изучение молекулярных основ патогенеза, выявление мишеней белкового происхождения для лекарственных средств и проектирование миметиков (белков с заданными свойствами).
Набор данных содержит 3.96 млн аннотаций структурных мотивов в белковых структурах с указанием внутренних координат. Обновление версии набора данных выходит не реже одного раза в год. Набор доступен в формате CSV.
Институт биомедицинской химии имени В. Н. Ореховича
Атрибут | Описание | Количество пропусков (NaN) (шт/%) | Единица измерения | ОКЕИ | Формат |
---|---|---|---|---|---|
experiment_id | Идентификатор трехмерной структуры в Protein Data Bank | 0 | string | ||
uniprot_id | Идентификатор белка в базе знаний UniProt | 1330 | string | ||
protein_name | Название белка | 101949 | string | ||
chain_id | Идентификатор белковой цепи в экспериментальной структуре | 98257 | string | ||
resolution | Разрешение трехмерной структуры белка | 2712626 | numeric | ||
experiment_type | Тип эксперимента, в котором получена трехмерная структура белка. | 0 | string | ||
biological_process | Биологический(е) процесс(ы), в которых участвует белок | 2436633 | string | ||
molecular_function | Функция(и), которую выполняет белок в клетке/организме | 2006228 | string | ||
fasta | Аминокислотная последовательность структурного мотива в формате однобуквенного кода | 0 | string | ||
apfid | Уникальный идентификатор мотива, который содержит указание на экспериментальную структуру, позиции начала и конца мотива | 0 | string | ||
motif_type | Тип структурного мотива | 0 | string | ||
motif_len | Длина структурного мотива | 0 | integer | ||
motif_start | Позиция начала структурного мотива в цепи белка | 1567 | integer | ||
motif_end | Позиция конца структурного мотива в цепи белка | 1567 | integer | ||
organism | Название организма, которому принадлежит белок (англ) | 98257 | string |
Спасибо!
Скачивание началось. Если загрузка
не произошла, нажмите на ссылку
Подтвердите номер телефона, чтобы скачать этот набор данных
На указанный номер телефона поступит звонок, 4 последние цифры которого нужно будет ввести в поле кода подтверждения. Поднимать трубку не нужно.
Введите последние 4 цифры номера входящего звонка
Указанный вами номер +7 (999) 888-77-66
Изменить номер
Повторный звонок с кодом подтверждения можно запросить через: 02:00
Если письмо не приходит в течение 10 минут:
1. Проверьте папку спам
2. Проверьте папку Промоакции
3. Возможно вы ввели адрес с ошибкой, попробуйте еще раз
Заполните данные профиля, чтобы продолжить пользоваться платформой
Обратная связь