このページの他言語版もあります: English

このページではPDBアーカイブに加え、RDFファイルやPDBjで独自にアノテーションを加えたPDBMLaddファイルを含む、PDBj FTPサイトで提供しているデータの詳細について記します。 ftpやrsyncによるダウンロード方法についてはダウンロードページをご覧下さい。

ディレクトリ構成の概要

以下にルートおよびコンテンツの種類ごとに分類したサブディレクトリの内容について、URLとともに記します。

内容 FTP URL
ドキュメントルート ftp://ftp.pdbj.org/
PDB Archiveルート(各局共通コンテンツ) ftp://ftp.pdbj.org/pub/pdb/data
二次データ(各局共通コンテンツ) ftp://ftp.pdbj.org/pub/pdb/derived_data
ドキュメント類(newsletterなど)(各局共通コンテンツ) ftp://ftp.pdbj.org/pub/pdb/doc
EMDB Archiveルート(各局共通コンテンツ) ftp://ftp.pdbj.org/pub/emdb
構造検証レポート(各局共通コンテンツ) ftp://ftp.pdbj.org/pub/pdb/validation_reports

ディレクトリ構成の詳細

[RDF]

pdb

pdb/[1-9][0-9a-z]{3}.rdf.gz

各PDBエントリーのPDBML(mmCIF)の内容をRDF形式に変換したものです。 wwPDB/RDF もご参照下さい。

例:PDBID 100dの場合
ftp://ftp.pdbj.org/RDF/pdb/100d.rdf.gz

chem_comp

chem_comp/[0-9A-Z]{3}.rdf.gz

各化学グループのmmCIFの内容をRDF形式に変換したものです。 wwPDB/RDF もご参照下さい。

例:ATPの場合
ftp://ftp.pdbj.org/RDF/chem_comp/ATP.rdf.gz

sifts

SIFTSのRDF形式のデータを収めています。
  • pdb_chain_cath_uniprot.ttl.gz
  • pdb_chain_enzyme.ttl.gz
  • pdb_chain_go.ttl.gz
  • pdb_chain_interpro.ttl.gz
  • pdb_chain_pfam.ttl.gz
  • pdb_chain_scop_uniprot.ttl.gz
  • pdb_chain_taxonomy.ttl.gz
  • pdb_chain_uniprot.ttl.gz
  • pdb_pubmed.ttl.gz
  • uniprot_pdb.ttl.gz
  •  

[XML]

オリジナルのPDBMLファイルおよびPDBjでアノテーションを加えたPDBMLaddを収めています。PDBMLの定義内容については http://pdbml.rcsb.org/ やPDBML Schema http://pdbml.pdb.org/schema/pdbx-v40.xsd をご覧下さい。

all

全データを収めたPDBMLファイルがあります。 /pub/pdb/data/structures/all/XML の内容と同じです。

例:PDBID 100dの場合
ftp://ftp.pdbj.org/XML/all/100d.xml.gz

all-extatom

原子座標部分だけを抽出したデータを収めたPDBMLファイルがあります。/pub/pdb/data/structures/all/XML-extatom の内容と同じです。

例:PDBID 100dの場合
ftp://ftp.pdbj.org/XML/all-extatom/100d-extatom.xml.gz

all-noatom

原子座標部分を除いたメタデータ部分のみを含むPDBMLファイルがあります。/pub/pdb/data/structures/all/XML-noatom の内容と同じです。

例:PDBID 100dの場合
ftp://ftp.pdbj.org/XML/all-noatom/100d-noatom.xml.gz

pdbmlplus

PDBML に、PDBjで独自に情報を追加した PDBMLaddファイル、およびそのスキーマファイル( ftp://ftp.pdbj.org/XML/pdbmlplus/PDBMLadd_v40.xsd)などがあります。

[doc]

newsletters

PDBjで発行しているニュースレターのPDFファイルがあります。ニュースレターページからダウンロードすることもできます。

  • en ... 英語版ニュースレター
  • ja ... 日本語版ニュースレター

[edmap]

このディレクトリには、電子密度マップ関連データが収められています。
  • edmap.list ... 電子密度マップデータが作成されているPDBIDの一覧
  • ccp4/([0-9a-z]{2})/[1-9]{1}[0-9a-z]{3}.ccp4.gz ... 電子密度マップデータ。PDBID中2文字ごとにサブディレクトリで分割して格納されている。

[emnavi]

[family]

[mine]

旧版PDBj Mineのデータベースダンプファイルなどがあります。旧版データの更新は2014年12月10日で終了しています。
新版PDBj Mineのデータベースデータについては次の"mine2"ディレクトリからご利用下さい。

[mine2]

現行版PDBj Mine のデータベースダンプファイルなどがあります。
  • mine2.dump ... PDBj Mine データベース全体を1つのファイルにダンプしたファイル
  • split/mine2.{aa,ab...} ... PDBj Mineデータベース全体を100MBごとに分割してダンプしたファイル群
  • weekly/mine2_update_yyyymd.sql.gz ... PDBj Mine データベースのyyyy年m月d日の増分。
  • readme.txt ... PDBj Mineデータベースをローカルインストールする方法について記しています。
  • keywords.txt
  • update.json
  • sifts ... このディレクトリでは、PDBeで開発されているSIFTSのデータをPDBj Mine2関係データベースに統合するためのSQLとシェルのスクリプトを提供しています。

[mmCIF]

mmCIFファイルです。/pub/pdb/data/structures/all/mmCIF/ にある内容と同じです。mmCIFフォーマットの定義内容については http://mmcif.pdbj.org/ をご覧下さい。

例:PDBID 100dの場合
ftp://ftp.pdbj.org/mmcif/100d.cif.gz

[model]

現在、PDBのメインデータ領域に格納しているデータは実験で決定された構造のみであり、理論モデルは除外されています。このディレクトリにはその除外された理論モデル構造のPDBファイルが保管されています。

例:PDBID 163dの場合
ftp://ftp.pdbj.org/model/pdb163d.ent.gz

[nmr]

NMR restraintファイルです。/pub/pdb/data/structures/all/nmr_restraints/ にある内容と同じです。

例:PDBID 108dの場合
ftp://ftp.pdbj.org/nmr/108d.mr.gz

[nmr_chemical_shifts]

NMRで解かれた構造の化学シフト情報ファイルです。/pub/pdb/data/structures/all/nmr_chemical_shifts/ にある内容と同じです。

例:PDBID 2l7eの場合
ftp://ftp.pdbj.org/nmr_chemical_shifts/2l7e_cs.str.gz

[nmr_v2]

NMR restraint version 2ファイルです。/pub/pdb/data/structures/all/nmr_restraints_v2/ にある内容と同じです。

例:PDBID 108dの場合
ftp://ftp.pdbj.org/nmr_v2/108d_mr.str.gz

[pdb]

PDBフォーマットファイルです。gzip形式で圧縮されています。/pub/pdb/data/structures/all/pdb にある内容と同じです。PDBフォーマットの書式については http://www.wwpdb.org/documentation/format33/v3.3.html をご覧下さい。

例:PDBID 100dの場合
ftp://ftp.pdbj.org/pdb/pdb100d.ent.gz

[pdb_h]

オリジナルのPDBフォーマットファイルから座標情報部分を取り除いたものです。gzip形式で圧縮されています。

例:PDBID 100dの場合
ftp://ftp.pdbj.org/pdb_h/pdb100d.ent.gz

[pdb_nc]

gzip圧縮されていないオリジナルのPDBフォーマットファイルです。

例:PDBID 100dの場合
ftp://ftp.pdbj.org/pdb_nc/pdb100d.ent

[structure_factors]

オリジナルの構造因子ファイルがあります。/pub/pdb/data/structures/all/structure_factors/ にある内容と同じです。

例:PDBID 100dの場合
ftp://ftp.pdbj.org/structure_factors/r100dsf.ent.gz

[prd]

[prdcc]

[pub/emdb]

wwPDB各局(wwPDB, RCSB PDB, PDBe and PDBj)共通コンテンツのEMDBアーカイブデータ

doc

obsoleted

structures

[pub/pdb]

wwPDB各局(wwPDB, RCSB PDB, PDBe and PDBj)共通コンテンツのPDBアーカイブデータ

compatible/pdb_bundle

巨大構造エントリーは、旧来から利用されているPDBフォーマットでは原子数や鎖数を扱い切れないため、 多くの旧来からあるソフトウェアが処理できるようにするため、複数のPDBフォーマットファイルに変換したファイル群が提供されています。
このディレクトリには、複数の著者、引用文献の詳細、座標データ等、巨大構造に対して”可能な範囲で表現された(best-effort, minimal)”制限付きPDBフォーマットファイル(群)と 巨大構造の鎖名と制限付きPDBフォーマット中の鎖名の対応付けを記載したマッピングファイルを1つにまとめて圧縮した、PDB bundleファイルが置かれています。
各エントリーのPDB bundleファイルは、PDB IDの2文字(2文字目と3文字目)を名前にもつディレクトリに分類されています。
例えば、1ABCのPDB bundleファイルは、/pdb/compatible/pdb_bundle/ab/1abc/というディレクトリに公開されています。
PDB bundleファイルは、gzip フォーマットで圧縮されています。(例:1abc-pdb-bundle.tar.gz)

data

derived_data

doc

software

validation_reports

全てのX線結晶構造についての検証レポートファイル群。
各エントリーのファイル群は、PDB IDの2文字(2文字目と3文字目)を名前にもつディレクトリに分類されています。
例えば、1ABCのレポートは、/pdb/validation_reports/ab/1abc/というディレクトリ以下で公開されています。
ファイルは全て、gzip フォーマットで圧縮されています。

各エントリーごとに、5種類のファイルが公開されています。

  • 標準版のwwPDB検証レポート(PDF) (例:1abc_validation.pdf.gz)
  • 完全版のwwPDB検証レポート(PDF) (例:1abc_full_validation.pdf.gz)
  • 全体的な品質を表す画像(PNG) (例:1abc_multipercentile_validation.png.gz)
  • 全体的な品質を表す画像(SVG) (例:1abc_multipercentile_validation.svg.gz)
  • 全ての診断を含むXML形式ファイル (XML) (例:1abc_validation.xml.gz)
2013-03-18 (last edited: 8 months ago)2016-06-29
PDBj@FacebookPDBj@TwitterwwPDBwwPDB FoundationEM DataBank

Copyright © 2013-2017 日本蛋白質構造データバンク