機能情報のページについて
2010年2月15日
[機能情報のページについて]
1) GO(ジーン・オントロジー)に由来する情報
GO(ジーン・オントロジー)のコンソーシアム
は、全ての生命体に対して利用される標準的な語句を構築しています。 そして、個々の蛋白質に関する生物学的役割、細胞内局在、各アミノ酸残基に起因する生化学的な分子機能などの情報が収集され、GOのページ
( http://geneontology.org/ontology/gene_ontology_edit.obo )で表示されています。
PDBjにて PDBML を拡張した PDBMLplus
では、このGOによるアノテーションを各蛋白質のアミノ酸鎖毎に付記しています。具体的には、それらのGOのIDへの情報の関連付けは、UniProt によるマッピングの情報 ( ftp://ftp.uniprot.org/pub/databases/uniprot/current_release/knowledgebase/idmapping/idmapping_selected.tab.gz
)に基づいて行われています。
2) PDBデータベースに由来する情報
PDBデータにもともとSITE(サイト)レコードとして含まれている機能部位の情報は、"SITE"という名称で表示されます。ポリマー鎖の名称と残基番号は、PDBファイル中に表示されているものと同一のものです。
3) "HETATM"原子の座標から抽出されたリガンド結合部位
蛋白質や核酸の構成原子以外の原子:"HOH", "WAT", "PO4", "SO4", "MSE", "TPO", "SEP", "PTR", "HIP", "PAS", "ASQ", "NA",
"CL"のいわゆる"HETATM"と称される原子が5以内にある残基について、これらの原子を含むリガンドの結合部位の情報として表示しています。ただし、3原子以内の小さな"HETATM"分子は、リガンドとは扱っていません。各機能部位の残基は、"binding
site"として表示されます。ポリマー鎖の名称と残基番号は、PDBファイル中に表示されているものと同一のものです。
4) UniProtにおけるモチーフ・データベースPROSITEからの機能情報
Scan Prosite ( http://www.expasy.org/tools/scanprosite/ )
によってアノテートされたPROSITE/UniProtのモチーフ配列としてのアミノ酸残基情報は、"PROSITE"として表示されています。
5) SwissProt/UniProtに記載されている蛋白質分子機能情報
SwissProt/UniProt
の蛋白質のアミノ酸配列データベースにおいて、Footnote (FT)として記載されている下記の分子機能情報を収集し、それぞれの名称で表示しています。
- ACT_SITE: 酵素の活性部位(ACT_SITE)
- METAL: 金属結合部位(METAL)
- CA_BIND: カルシウム・イオン結合部位(CA_BIND)
- BINDING: リガンド結合部位(BINDING)
- SITE: その他の部位(SITE)
- DNA_BIND:DNA結合領域(DNA_BIND)
- NP_BIND: 核酸におけるリン酸結合部位(NP_BIND)
- ZN_FING: Znフィンガー・領域(ZN_FING)
- TRANSMEM: 膜貫通部位(TRANSMEM)
ポリマー鎖の名称と残基名は、PDBファイル中に表示されているものと同一のものですが、SwissProt/UniProt の配列データとPDBデータとを自動的にアラインメントして、残基番号はPDBデータに対応するように調整しています。
6) CSAにおける酵素触媒機能の情報
酵素蛋白質の触媒機能情報については、C.T.Porter, G.J.Bartlett, and J.M.Thornton によってアノテートされたCSA (Catalytic Site Atlas)
データベース ( http://www.ebi.ac.uk/thornton-srv/databases/CSA/
)があります。site_idとして"CSA#"(#はID番号)が、またその部位のtypeとして"catalytic
site"が割り振られています。ポリマー鎖の名称と残基番号は、PDBファイル中に表示されているものと同一のものです。
7) CATRESにおける酵素触媒機能の情報
酵素蛋白質の触媒機能情報については、CSAと同一のグループであるG.J.Bartlett, C.T.Porter, N. Borkakoti, and J. M.
ThorntonによってアノテートされたCATRES (Catalytic Residue Dataset)データベース ( http://www.ebi.ac.uk/thornton-srv/databases/CATRES/
)も公開されています。site_idとして"CATRES#"(#はID番号)が、またその部位のtypeとして"catalytic site"が割り振られています。
CATRESでアノテートされている蛋白質のホモログ蛋白質についても、アミノ酸のアラインメントを行って、自動的にPDBデータから抽出して、そのポリマー鎖の名称と残基番号を、拡張されたextCATRESとして表示しています。この場合には、site_idとして"extCATRES#"(#はID番号)が、またその部位のtypeとして"catalytic
site"が割り振られています。
extCATRESにおいて、ホモログ蛋白質から機能部位を抽出する仕組みは次のようになっています。
1) オリジナルのCATRESファイルから、PDBに登録されているアミノ酸配列を抽出します。
2) BLASTサーチによって、その配列のホモログ配列を有する蛋白質を含むPDBファイルを抽出します。
3) CATRESにある全ての触媒残基が完全に一致している(100%一致)の場合には、抽出された配列も、オリジナルなCATRESの触媒機能と同様の機能を持つ可能性が高いと考えられます。
4)
この抽出された触媒機能部位の立体構造の類似性を最後に評価します。スーパーインポーズした時のRMSD(平均二乗偏差の根)が3以内のときには、このホモログ蛋白質の機能は、もとのCATRESに含まれている蛋白質と同じと判断され、extCATRESとしてXML形式で記載されます。