PDBデータの書式
[PDB format]
1行が80列の固定長となっている、テキスト形式の書式です。 最も古くから用いられています。
詳細は以下のサイトに記されています(英語)。
各レコードの簡易版説明 (日本語)
[mmCIF]
結晶構造のデータ書式として用いられるCIFを高分子用に拡張したもので、PDBMLはこのデータに基づいてつくられています。
mmCIFの辞書は、以下のサイトから参照できます。
[PDBML]
PDBML は下記文献で最初に紹介された PDBデータの正式なXML形式のフォーマットです。
PDBML: the representation of archival macromolecular structure data in
XML.
Westbrook J, Ito N, Nakamura H, Henrick K, Berman HM.
Bioinformatics, 2005, 21(7):988-992. PubMed:15509603 full
text
データ構成規則について記したスキーマファイルを下記アドレスから参照できます。
PDBMLには下記3種類のデータ型があります。
- PDBML... 全てのデータが含まれています
- PDBML-noatom... 原子座標部分を除いたものです。
- PDBML-extatom... 原子座標部分だけを取り出し、原子ごとの情報を1つの要素にまとめたものです。
[PDBMLadd/PDBMLplus]
現在PDB各局で共通に提供しているデータには機能、実験条件などの詳細な記述が含まれていません。 PDBjではこれらの追加情報を独自に収集した内容を収めたXMLファイルも合わせて提供しています。 現在はファイルとしてFTPサイトから提供しているのは、この追加部分のみを含むPDBMLaddです。 PDBMLにPDBMLaddの内容を追記したPDBMLplusが必要な方は、各エントリーのダウンロードページをご利用下さい(オンデマンドで生成するインタフェースを用意しています)。
[NMR距離制限情報]
2008年2月1日より、NMRによって解析された構造を登録する際には、NMR制限情報の登録が必須となっています。
詳細は、NMR距離制限情報をご覧下さい。
[NMR化学シフト]
2010年12月6日より、NMRによって解析された構造を登録する際には、化学シフトの登録が必須となっています。
登録時には、 NMR-STAR v3.1形式の化学シフトファイルと座標ファイル内の原子の命名法が矛盾していないかが検証されます。
詳細は、NMR化学シフトをご覧下さい。
[構造因子]
mmCIFフォーマットで表現された構造因子データで、2008年2月1日より、X線結晶解析による構造を登録する際には、構造因子ファイルの登録が必須となっています。 詳細は、構造因子をご覧下さい。
[RDF]
- 詳しくは wwPDB/RDF をご覧下さい。
PDBデータはRDF(Resource Description Framework)形式でも参照することができます。 RDFファイルは、XSLTを使ってPDBMLファイルから自動的に生成されています。 オントロジーも定義していますが、その内容はPDB mmCIF Exchange Dictionaryに基づいています。 RDFファイルは各PDBエントリーごとに作られており、例えばPDBエントリー 1GOF のRDFデータは http://rdf.wwpdb.org/pdb/1GOF からアクセスできます。
- http://rdf.wwpdb.org/pdb... wwPDB/RDFデータの単純な(ヒトでも読みやすい)インタフェース
- http://rdf.wwpdb.org/schema/pdbx-v50.owl... PDB/RDFデータのOWLオントロジー