
Swiss-Prot は、タンパク質アミノ酸配列の知識ベースである[1][2]。 Swiss-Prot は、1986年に Amos Bairoch が大学院博士課程に在籍しているときに開発がはじまり、現在では、スイスバイオインフォマティクス研究所 (SIB, Swiss Institute of Bioinformatics) と欧州バイオインフォマティクス研究所 (EBI, European Bioinformatics Institute) が共同で開発し運営している[3][4]。 Swiss-Prot は、高い水準の注釈(アノテーション)(タンパク質の機能の説明、ドメイン構造の説明、翻訳後修飾の説明、バリアント(アミノ酸一個の相違しかないような類縁物質)の説明、など)がつけられた信頼性のあるタンパク質アミノ酸配列を提供することに力を入れている。 配列データの冗長性は最小限に抑えている。 他のデータベースと高い水準で統合している。


2002年に、UniProtコンソーシアムが結成された[5][6]。 UniProtコンソーシアムは、スイスバイオインフォマティクス研究所 (SIB, Swiss Institute of Bioinformatics) と欧州バイオインフォマティクス研究所 (EBI, European Bioinformatics Institute) 、タンパク質情報リソース (PIR, Protein Information Resource) の共同活動組織である。 なおタンパク質情報リソースは、アメリカ合衆国国立衛生研究所 (NIH) から支援を受けている。 Swiss-Prot と TrEMBL(EMBL/GenBank/DDBJ国際塩基配列データベースから自動翻訳して構築されたデータベースであり、Swiss-Prot を補完するデータベースである)およびタンパク質情報リソース (PIR) は、統合してUniProt知識ベース (UniProtKB) を構築している UniProtは、世界でもっとも広範なタンパク質についての情報のカタログである[7]。 2008年12月16日現在、UniProtKB/Swiss-Prot リリース 56.6 は 405,506 のエントリを格納しており、UniProtKB/TrEMBL リリース 39.6 は 6,964,485 のエントリを格納している。

UniProtコンソーシアムは、3つのデータベース構成要素を提供している。 3つのデータベース構成要素のそれぞれが、異なる用途に最適化されている。 3つのデータベース構成要素とは、UniProt知識ベース (UniProtKB (Swiss-Prot + TrEMBL)) 、UniProtの冗長性のないリファレンス (UniRef) のデータベース群[8]、UniProt Archive (UniParc) [9]の、3つである。 UniRef は、高速な類似性検索に供するため類縁性の強い配列を単一の配列データにまとめたデータベース群である。 UniParc は、タンパク質アミノ酸配列の広範なリポジトリであり、すべてのタンパク質アミノ酸配列の履歴を含んでいる。


  1. ^ Boeckmann B, Bairoch A, Apweiler R, et al (January 2003). “The SWISS-PROT protein knowledgebase and its supplement TrEMBL in 2003”. Nucleic Acids Res. 31 (1): 365–70. doi:10.1093/nar/gkg095. PMC 165542. PMID 12520024. 
  2. ^ Boutet E, Lieberherr D, Tognolli M, Schneider M, Bairoch A (2007). “UniProtKB/Swiss-Prot”. Methods Mol. Biol. 406: 89–112. doi:10.1007/978-1-59745-535-0_4. PMID 18287689. 
  3. ^ Bairoch Amos (2000). “Serendipity in bioinformatics, the tribulations of a Swiss bioinformatician through exciting times!”. Bioinformatics 16: 48–64. doi:10.1093/bioinformatics/16.1.48. PMID 10812477.  — a historical account by Bairoch.
  4. ^ Séverine Altairac, "Naissance d’une banque de données: Interview du prof. Amos Bairoch". Protéines à la Une, August 2006. ISSN 1660-9824.
  5. ^ Bairoch A, Apweiler R, Wu CH, et al (January 2005). “The Universal Protein Resource (UniProt)”. Nucleic Acids Res. 33 (Database issue): D154–9. doi:10.1093/nar/gki070. PMC 540024. PMID 15608167. 
  6. ^ “The Universal Protein Resource (UniProt) 2009”. Nucleic Acids Res. 37: D169. (October 2008). doi:10.1093/nar/gkn664. PMID 18836194. 
  7. ^ Wu, C.H. et al. (January 2006) "The Universal Protein Resource (UniProt): an expanding universe of protein information.". Nucleic Acids Research, 1;34 (Database issue): D187–91.
  8. ^ Suzek BE, Huang H, McGarvey P, Mazumder R, Wu CH (May 2007). “UniRef: comprehensive and non-redundant UniProt reference clusters”. Bioinformatics 23 (10): 1282–8. doi:10.1093/bioinformatics/btm098. PMID 17379688. 
  9. ^ Leinonen R, Diez FG, Binns D, Fleischmann W, Lopez R, Apweiler R (November 2004). “UniProt archive”. Bioinformatics 20 (17): 3236–7. doi:10.1093/bioinformatics/bth191. PMID 15044231. 
