8. 原子表現
分子内のある原子グループを特定するための表記方法は以下の通り。
標準の論理値演算子である'and'、'or'、'not'、そして括弧を使って複雑な表現ができます。 論理値演算子はそれぞれ '&'、'|'、'!' の省略形が利用できます。
8.1. 既定グループ名
8.1.1 元素名
carbon や nitrogen といった英語の元素名が原子の指定に利用できます。
1H hydrogen (水素) |
2He helium (ヘリウム) |
||||||
3Li lithium (リチウム) |
4Be beryllium (ベリリウム) |
5B boron (ホウ素) |
6C carbon (炭素) |
7N nitrogen (窒素) |
8O oxygen (酸素) |
9F fluorine (フッ素) |
10Ne neon (ネオン) |
11Na sodium (ナトリウム) |
12Mg magnesium (マグネシウム) |
13Al aluminum (アルミニウム) |
14Si silicon (ケイ素) |
15P phosphorus (リン) |
16S sulfur (硫黄) |
17Cl chlorine (塩素) |
18Ar argon (アルゴン) |
元素番号 | 元素記号 | 元素名(日本語) | 要素名(英語元素名) |
---|---|---|---|
19 | K | カリウム | potassium |
20 | Ca | カルシウム | calcium |
25 | Mn | マンガン | manganese |
26 | Fe | 鉄 | iron |
29 | Cu | 銅 | copper |
30 | Zn | 亜鉛 | zinc |
34 | Se | セレン | selenium |
53 | I | ヨウ素 | iodine |
55 | Cs | セシウム | cesium |
74 | W | タングステン | tungsten |
※原子番号103(Lr lawrencium ローレンシウム)までの各元素が指定に利用できます。
8.1.2 残基の性質に基づくグループ
ALA | ARG | ASN | ASP | CYS | GLU | GLN | GLY | HIS | ILE | LEU | LYS | MET | PHE | PRO | SER | THR | TRP | TYR | VAL | |
Acidic(酸性) | * | * | ||||||||||||||||||
Acyclic(非環式) | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * | |||||
Aliphatic(親水性) | * | * | * | * | * | |||||||||||||||
Aromatic(芳香環) | * | * | * | * | ||||||||||||||||
Basic(基本) | * | * | * | |||||||||||||||||
Buried(埋もれた) | * | * | * | * | * | * | * | * | ||||||||||||
Charged(荷電) | * | * | * | * | * | |||||||||||||||
Cyclic(環状) | * | * | * | * | * | |||||||||||||||
Hydrophobic(疎水性) | * | * | * | * | * | * | * | * | * | * | ||||||||||
Large(大) | * | * | * | * | * | * | * | * | * | * | * | |||||||||
Medium(中) | * | * | * | * | * | * | ||||||||||||||
Negative(負電荷) | * | * | ||||||||||||||||||
Negative(中性) | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * | ||||
Polar(極性) | * | * | * | * | * | * | * | * | * | * | ||||||||||
Positive(正電荷) | * | * | * | |||||||||||||||||
Small(小) | * | * | ||||||||||||||||||
Surface(表面) | * | * | * | * | * | * | * | * | * | * | * | * | ||||||||
Cysteine(システイン) | * | |||||||||||||||||||
Amino(アミノ酸) | 上記20アミノ酸 + その他アミノ酸※1 | |||||||||||||||||||
Protein(タンパク質) | Amino + UNK, ACE, FOR(PDBフォーマット2.3のみに存在) |
※1:その他アミノ酸には種別(mmCIF/PDBMLのchem_comp/type)が以下のいずれかである化学物質が含まれます。化学物質については化学物質辞書(Chemical Component Dictionary)もご覧下さい。
- D-peptide linking
- D-peptide NH3 amino terminus
- L-peptide COOH carboxy terminus
- L-peptide linking
- L-peptide NH3 amino terminus
- peptide linking
- peptide-like
A | C | G | T | U | +U | I | 1MA | 5MC | OMC | 1MG | 2MG | M2G | 7MG | OMG | YG | H2U | 5MU | PSU | |
AT | * | * | |||||||||||||||||
CG | * | * | |||||||||||||||||
Purine(プリン) | * | * | |||||||||||||||||
Pyrimidine(ピリミジン) | * | * | |||||||||||||||||
DNA | * | * | * | * | |||||||||||||||
RNA | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * | |
Nucleic | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * |
DA | DC | DG | DT | A | C | G | U | other DNA※3 | other RNA※3 | |
AT | * | * | ||||||||
CG | * | * | ||||||||
Purine(プリン) | * | * | * | * | ||||||
Pyrimidine(ピリミジン) | * | * | * | * | ||||||
DNA | * | * | * | * | * | |||||
RNA | * | * | * | * | * | |||||
Nucleic | * | * | * | * | * | * | * | * | * | * |
※2: other DNAには種別(mmCIF/PDBMLのchem_comp/type)が「DNA linking」である化学物質が含まれます。化学物質については化学物質辞書(Chemical Component Dictionary)もご覧下さい。
※3: other RNAには種別(mmCIF/PDBMLのchem_comp/type)が「RNA linking」である化学物質が含まれます。化学物質については化学物質辞書(Chemical Component Dictionary)もご覧下さい。
HOH | DOD | SO4 | PO4 | |
Water(水) | * | * | ||
Ions(イオン) | * | * | ||
Solvent(溶媒) | * | * | * | * |
8.1.3 その他
Alpha (α炭素) |
α位の炭素、CAと名づけられているもの(= 「*.CA & !CA 」、原子IDが「CA」でグループ名が「CA」(カルシウム)でないもの)。
|
Hetero (ヘテロ) |
PDBファイルでHETATMとして記されている原子、または溶媒中の原子。 |
Ligand (リガンド) |
ヘテロ原子のうち、溶媒原子を除いたもの。 |
Backbone Mainchain (主鎖) |
アミノ酸中のCA(α炭素)およびN、C、O原子(主鎖のアミノ基・カルボキシル基)、 あるいは核酸中のP、O1P、O2P、O5'、O4'、O3'、O2'、C5'、C4'、C3'、C2'、C1'(リン酸と(デオキシ)リボース) 主鎖対象原子はadd_backboneコマンドで一時的に変更することができます。 |
Sidechain (側鎖) |
アミノ酸や核酸の分子で、主鎖に含まれない部分。 |
Bonded (結合) |
1つ以上の他の原子と結合している原子。 |
Selected (選択中) |
現在選択中の原子。 |
Helix (らせん) |
αらせん構造部分を構成する原子。 |
Sheet (シート) |
βシート構造部分を構成する原子。 |
Turn (折り返し) |
折り返し構造部分を構成する原子。 |
(グループ名) |
グループ名に該当する原子が選択されます。
GLY(グリシン)などのアミノ酸名、DA(DNAのアデニン)などのヌクレオチド名、
その他HETATM項目に記載されたグループ名が使用できます。 数字を含むグループ名を扱う際は、グループ名を大括弧([ ])で囲んで指定して下さい(例: select [so4] )。
|
8.2. 比較演算子
分子の一部分を等号、不等号を用い、その属性に従って並べ替えることができます。 使える演算子は =、==、<>、!=、/=、<、<=、>、>= です。 使える属性名は以下の通り。
AtomNo(原子固有番号) |
PDBMLファイルの「PDBx:atom_siteCategory/PDBx:atom_site id」に記載された各原子の固有の番号。
PDBフォーマットファイルの「ATOM/HETATM」行の第2項目にも類似の値が掲載されていますが、これとは必ずしも一致しないので注意。
例:固有番号1217番の原子を選択する。→
select atomno=1217 (例017) |
ElemNo(原子番号) |
原子番号です。
例:原子番号26の原子(鉄 Fe)を選択する。→
select elemno=26 (例017)英語の元素名で同様の指定を行うこともできます(→元素名参照、上例の場合
select iron と記すこともできます)。 |
ResNo(残基番号) | PDBファイルに記載された残基番号。 |
Radius(半径) | 原子の球状図における半径。 |
Temperature(温度) | 原子の温度因子。 |
Model(モデル) | PDBファイルにおけるモデル番号。 |
File(ファイル) | ファイルIDです。 |
8.3. 残基範囲
分子内の任意の官能基を残基IDで選択できます。例えば、コマンド「select 3
」では各鎖の残基ID 3 含まれる原子が、「select 3-10
」では各鎖の残基ID3〜10に含まれる原子が選択されます。残基番号の後にコロン(:)+鎖IDを記せば、特定の鎖の残基だけを選択することができます(例:「select 3:A
」→A鎖の残基ID 3 に含まれる各原子を選択)。鎖選択にはいくつかの方法があります。詳しくは8.6. 基本表現をご覧下さい。
8.4. 距離による表現
ある原子から一定距離内にある原子を選択できます。 例えば、"select within(3.0, backbone)" という表現で、タンパク質または核酸の主鎖から3.0Å以内にある全ての原子を選択できます。
例:select (*A | *B) & within(3.0,(*C | *D))
→A鎖またはB鎖にある原子の中で、C鎖またはD鎖のいずれかの原子と3.0Å以内にある原子を選択する。
8.5. PDBj表現
PDBj表現を使うと、「PDBMLplus」ファイルの記述に基づいて原子群を指定することができます。 PDBj表現は以下の形式で記述します。
【書式】
pdbj:キーワード
【例】'show pdbj'コマンドで得られる各分子のキーワードを得る
select pdbj:binding
使用できるキーワードのリストはshow pdbj
コマンドで確認できます。
【例】 jV> show pdbj File 1: type subtype --------------------- Swiss-Prot ACT_SITE Swiss-Prot METAL Swiss-Prot BINDING Swiss-Prot TRANSMEM pdb_hetatom binding CSA catalytic
appletでPDBj表現を利用しようとするとエラーが出る場合、PDBMLplusファイルにアクセスできない状況にあることが考えられます。
8.6. 基本表現
基本表現は次の通りです。
残基名 [残基ID][:鎖ID][.原子名][;交代位置][/モデルID][@ファイルID]
ここで指定する残基名は3文字で、原子名は4文字以内で指定します。角かっこで囲まれた語句は省略できます。例えば、select SER.CA
コマンドは、セリン残基に含まれる全てのα炭素を選択します。全残基を指定するには *
を指定します(例:"*.CA
"→全残基のα炭素、"*.CA & *:A
"→A鎖のα炭素全て)。
残基名に数字を含む場合は残基名を各かっこで囲って下さい(例:[SO4])。
各指定値は原則として大文字小文字は区別されません。但し、鎖IDに「a_」を付加した場合、指定値は大文字小文字を区別して処理されます(例:a_a→a鎖、a_A→A鎖、A→a鎖またはA鎖)。
またここで指定する残基名、残基ID、鎖ID、原子名は原則として著者によって定義された値(auth_seq_id、auth_comp_id、auth_asym_id、auth_atom_id)ですが、鎖IDについては冒頭に「l_」を付加すれば、系統的に割り振られた鎖ID(label_asym_id、PDBフォーマットファイルにはなく、mmCIF/PDBMLのみに掲載されている値)として解釈されます(例:l_AA→label_asym_idのAA)。