構成要素情報
主要項目テーブルbrief_summaryでは 選択可能な高分子鎖の種別名を番号に置き換えてchain_type_idsカラムに保存しています。 高分子鎖の種別名と番号の対応は以下の通りです。 なお現在のPDBにおいて多糖は高分子種から除外されています。
- D体アミノ酸でできたポリペプチド(polypeptide(D))
- L体アミノ酸でできたポリペプチド(polypeptide(L))
- デオキシリボ核酸でできたポリヌクレオチド=DNA(polydeoxyribonucleotide)
- リボ核酸でできたポリヌクレオチド=RNA(polyribonucleotide)
- D体単糖で構成された多糖(polysaccharide(D))
- L体単糖で構成された多糖(polysaccharide(L))
- DNA/RNA混合体(polydeoxyribonucleotide/polyribonucleotide hybrid)
- 環状ペプチド様物質(cyclic-pseudo-peptide)
- その他(other)
各PDBエントリーには1つ以上の分子が含まれており、分子種ごとにentity idと呼ばれる値が割り振られています。 このIDは同一エントリー内では重複しない固有の値になっています。 同一分子種の分子は複数個含まれる場合もあり、個々の分子を識別するためentity idとは別に鎖ID(Chain ID)と呼ばれる識別子があります。 鎖IDには構造登録者が定義したauth asym idと、PDB側で系統的に割り振ったlabel asym idとがあります。 前者は必ずしもAから始まるとは限らず、アルファベット順に連続した値が採用されているとも限りません。 このIDはPDBフォーマットにもPDBx/mmCIFにも記載されているIDです。 一方後者はAからアルファベット順に連続した文字をつかって割り振られています。 こちらはPDBx/mmCIFにしか記載されていません。 これらのIDが記載されているPDBx/mmCIFのカテゴリ.要素を以下に記します。
項目 | カテゴリ.要素 |
---|---|
分子種ID(entity id) | |
構造登録者が定義した鎖ID(auth asym id) | pdbx_poly_seq_scheme.pdb_strand_id |
PDBで定義した鎖ID(label asym id) | pdbx_poly_seq_scheme.asym_id |
以下に構成要素情報に関する検索例を挙げます。
- キーワード(struct_keywords.pdbx_keywords)とそのキーワードが定義されているPDBエントリーの件数を得る(件数の多い順、大文字小文字の区別なし)
- 人工合成の高分子とそうでない高分子の両方が含まれるエントリーのPDBID一覧を得る
- 同じ鎖の含まれている数(分子数)が多いものから5つについて、PDBIDとentity IDを得る
- EC番号が1.1.1.1であるエントリーのPDBID, entity ID, ChainID(label_asym_id)と分子名を得る
- 高分子鎖の中にD体ポリペプチド(polypeptide(D))を含むエントリーのPDBIDを得る
- 高分子鎖の中にD体とL体両方のポリペプチド鎖を含むエントリーのPDBIDを得る
- 高分子鎖の中にD体またはL体のポリペプチド鎖を含むエントリーのPDBIDを得る
- 高分子鎖の中にDNA(polydeoxyribonucleotide)を含まないエントリーのPDBIDを得る
- DNA鎖とRNA鎖を共に含んでいるものを除いたエントリーのPDBIDを得る
- 高分子鎖の中にD体アミノ酸でできたポリペプチド(polypeptide(D))だけを含むエントリーのPDBIDを得る
- 分解能が2.0Åより高いエントリーのPDBIDを得る
- 各PDBエントリーのPDBIDと高分子鎖の合計化学式量を得る(合計化学式量の多い順)
- 各PDBエントリーのタイトル(pdbx_descriptor)、キーワード(pdbx_keywords)、単位格子の3辺の長さと角度、高分子鎖の数、高分子鎖の合計化学式量を得る
- PDBエントリー1a14に含まれる残基の数を得る
- PDBID 1a14 のentity_id(鎖、分子ごとの識別ID)、label_asym_id(PDBで系統的に定義したChainID)とauth_asym_id(構造登録者が定義したChainID)との対応情報を得る
- 非ポリマー分子を含むが、pdbx_nonpoly_schemeCategoryを持たないエントリーのPDBID、entity_id、および分子の説明(pdbx_description)を得る(出力はPDBID値の小さい順)
- PDBエントリー1p8jのentity_id 4番と7番について、PDBID、entity_id、label_asym_id(PDBで規定したChainID)、auth_asym_id(登録者が定義したChainID)、残基名を得る
- PDBエントリー1p8jのentity_id 4番と7番について、entity_id、label_asym_id(PDBで規定したChainID)、auth_asym_id(登録者が定義したChainID)、配列(chem_comp_id 表記をハイフンでつないだ値)を得る
- 巨大構造エントリー(1つのPDBフォーマットファイルで記述できない大きな構造)のPDBIDとポリマー鎖数を得て、ポリマー鎖数の少ない順(昇順)に表示する
- 巨大構造エントリー(1つのPDBフォーマットファイルで記述できない大きな構造)のPDBIDと化学式量を表示(表示順は化学式量が大きい順)
- PDBエントリー1babに含まれる各高分子鎖のentity ID、Chain ID(auth_asym_id)、UniProt IDを得る
- 2種類の生物種に由来するキメラタンパク質のPDBID、エンティティID、Taxonomy IDを得る
- 配列「TVSFSWNKFVPKQPNMILQGDAIVTSSGKLQLNKVDENGTPKPSSLGR」を含み、かつ由来生物種がダイズ(Glycine max)である構造のPDBID+ChainID(auth_asym_id)を得る
- 「ペプチド鎖」と「水を除く低分子」の両方を含むエントリーのPDBIDを得る
- 2016年に最初の登録が行われたキナーゼ(EC 2.7)のPDBID、entity_id、label_asym_id、分子名を得る
- エンティティ(鎖)の名称に「phospholipase C」を含む構造のPDBIDと鎖ID(auth_asym_id、label_asym_id)、エンティティID、エンティティ名を得る
- エンティティ(鎖)の名称に「phospholipase C」を含み由来生物種が「ラット」である構造のPDBIDと鎖ID(auth_asym_id、label_asym_id)、エンティティID、エンティティ名を得る
- PDBエントリー4uv7の鎖ID(auth_asym_id、lable_asym_id)、エンティティID、エンティティ名、鎖の種別(高分子かどうか)を得る
作成日: 2021-02-01 (最終更新日: more than 1 year ago)