653
0
详细信息
Protein Data Bank(PDB)数据库简介
蛋白质结构数据库(ProteinData Bank,PDB) 是1971年创建的国际上最著名、最完整的蛋白质三维结构数据库。PDB以收集的蛋白质三维结构公共数据为核心,附带核酸、糖类三维结构和各类由 X 射线衍射结晶学家、核磁共振谱分析学家通过实验测定的合成物。
PDB 中的 134,146 个结构具有结构因子文件。10,289 个结构具有 NMR 约束文件。PDB 中的 4,814 个结构具有化学位移文件。PDB 中的 4,718 个结构具有存放在 EM 数据库中的 3DEM 映射文件。从历史上看,PDB 中的结构数量以近似指数的速度增长,1982 年有 100 个注册结构,1993 年有 1,000 个结构,1999 年有 10,000 个,2014 年有 100,000 个。
PDB 记录包括两个序列信息备份:隐性序列和显性序列。两者都被用于重构生物高聚体的化学图像。显性序列在 PDB 文件中以关键词 SEQRES 打头逐行存储。不同于其它序列数据库,PDB 记录用三字母氨基酸编码,任意选择三个字母作为名称的非标准氨基酸在许多 PDB 记录序列条目中可被找到。在 PDB 中,一些双螺旋核酸序列条目被指定依照在条目中按从 3’到 5’端的顺序排列的一条链在上,从 5’到 3’端排列的互补链在下的方式排列。PDB 记录中的隐性序列蕴涵在由 PDB 文件中的 ATOM 记录及相应(X,Y,Z)位置坐标构成的化学立体结构中。
随机推荐