687
0
详细信息
UniProt数据库简介
Uniprot数据库是资源最广、信息最丰富的蛋白质数据库,是查询蛋白功能的首选数据库。Uniprot数据库由Swiss-Prot、TrEMBL和PIR-PSD三大子数据库构成,数据主要来自于各物种基因组测序完成后得到的全基因蛋白质序列,并包含了很多来自文献中的蛋白及其功能信息。尤其是swiss-prot 子数据库,库中蛋白质信息都是手工核对过的 ,非冗余, 有详细注释信息的蛋白数据。
UniProt数据库,主要包括UniProtKB知识库、UniParc归档库、UniRef参考序列集、Proteomes蛋白组四部分。其中UniProtKB知识库是UniProt的核心,除蛋白质序列数据外,还包括大量注释信息。UniProtKB知识库分Swiss-Prot和TrEMBL两个子库。UniParc归档库将存放于不同数据库中的同一个蛋白质归并到一个记录中以避免冗余,并赋予序列唯一性特定标识符。UniRef参考序列集按相似性程度将UniProtKB和UniParc中的序列分为UniRef100、UniRef90和UniRef50三个数据集。Proteomes蛋白组是2011年新增加的数据库,主要是收集已经完成全基因组测序物种的核酸序列翻译所得的蛋白质序列。此外,UniProt数据库还包括文献引用(Literature Citations)、物种分类学来源(Taxonomy)、亚细胞定位(Subcellular Locations)、数据库交叉链接(Cross-reference Databases)、相关疾病(Diseases)和关键词(Keywords)等辅助数据。 这几部分内容在网站主页都有具体模块体现。
随机推荐