Loading
PDBj
メニューPDBj@FacebookPDBj@TwitterPDBj@YouTubewwPDB FoundationwwPDB
RCSB PDBPDBeBMRBAdv. SearchSearch help

PDBj データサイト・FTPサイトの詳細

このページの他言語版もあります: English

このページでは、PDBjのデータアーカイブ内のファイルについて説明します。 ftpやrsyncによるダウンロード方法についてはダウンロードページをご覧下さい。

また、wwPDBコアアーカイブ(PDB/EMDB)@PDBjについても以下をご覧ください。

データアーカイブ内のファイルについて

efsite/data-web/${entryId}.mpbf.gz
pdb_versionedwwPDBメンバーサイト間で共通(バージョン化されたPDBデータ)
data
entries
${id23}/pdb0000${pdbid}/
pdb_0000${pdbid}_xyz-ext-atom_v${version}.xml.gz
pdb_0000${pdbid}_xyz-no-atom_v${version}.xml.gz
pdb_0000${pdbid}_xyz_v${version}.cif.gz
pdb_0000${pdbid}_xyz_v${version}.xml.gz
removed
${id23}/pdb0000${pdbid}/
pdb_0000${pdbid}_xyz-ext-atom_v${version}.xml.gz
pdb_0000${pdbid}_xyz-no-atom_v${version}.xml.gz
pdb_0000${pdbid}_xyz_v${version}.cif.gz
pdb_0000${pdbid}_xyz_v${version}.xml.gz
views
all
coordinates
mmcif
${id23}/pdb0000${pdbid}/
pdb_0000${pdbid}_xyz_v${version}.cif.gz
pdbml
${id23}/pdb0000${pdbid}/
pdb_0000${pdbid}_xyz_v${version}.xml.gz
latest
coordinates
mmcif
${id23}/pdb0000${pdbid}/
pdb_0000${pdbid}_xyz.cif.gz
pdbml
${id23}/pdb0000${pdbid}/
pdb_0000${pdbid}_xyz.xml.gz
pdbjpluswwPDBのデータを利用してPDBjが作成したデータ
data
cc化合物(chem_comp)データ (Chemie)
mdl
${comp_id}.mdl.gz
mmcif
${comp_id}.cif.gz
mmjson
${comp_id}.json.gz
mmjson-plus
${comp_id}-plus.json.gz
rdf
${comp_id}.rdf.gz
svg
${comp_id}.svg.gz
xml
${comp_id}.xml.gz
ccmodel
mmcif
${model_id}.cif.gz
mmjson
${model_id}.json.gz
pdbPDB データ
mmjson
${pdbid}.json.gz
mmjson-chain
${pdbid}_${asym_id}-chain.json.gz
mmjson-noatom
${pdbid}-noatom.json.gz
mmjson-plus
${pdbid}-plus.json.gz
rdf
${pdbid}.rdf.gz
prdBIRD データ
mmcif
${prd_id}.cif.gz
mmcif-cc
${prd_id}-cc.cif.gz
mmjson
${prd_id}.json.gz
svg
${prd_id}.svg.gz
siftsSIFTS データ
rdf
pdb_chain_cath_uniprot.ttl.gz
pdb_chain_enzyme.ttl.gz
pdb_chain_go.ttl.gz
pdb_chain_interpro.ttl.gz
pdb_chain_pfam.ttl.gz
pdb_chain_scop_uniprot.ttl.gz
pdb_chain_taxonomy.ttl.gz
pdb_chain_uniprot.ttl.gz
pdb_chain_uniprot_short.ttl.gz
pdb_pubmed.ttl.gz
uniprot_pdb.ttl.gz
dictionaries各種ディクショナリ・スキーマ
edmap2電子密度マップデータ
ccp4
${pdbid}_validation_${type}_map_coef.ccp4
mtz
${pdbid}_validation_${type}_map_coef.mtz
edmap.list
mine2
dumpPostgreSQL関係データベース(RDB)ダンプファイル
rdb_docsRDBドキュメント(jsonフォーマット)
schemaRDB スキーマ定義(YAMLフォーマット、mine2updaterで使用)
statisticsRDB 統計:各列ごとに非ヌル要素の数の一覧
promode/data_web/${entryId}/二次データベースPromode Elasticのウェブデータ
pubwwPDBメンバー間で共通(PDB/EMDBアーカイブ)
emdb
doc
obsoleted/${emdb_id}/header廃止された(Obsolete)エントリーのヘッダファイル
${emdb_id}-v19.xml
${emdb_id}-v30.xml
${emdb_id}.xml
status
archive週次更新の履歴
latest最新の更新状況
structures/${emdb_id}/公開中のエントリーのデータファイル
header
${emdb_id}-v19.xml
${emdb_id}-v30.xml
${emdb_id}.xml
images/${emdb_id}.png
map/${emdb_id}.map.gz
${emdb_id}-v19.xml
validation_reports/${emdb_id}/
${emdb_id}_full_validation.pdf.gz
${emdb_id}_validation.pdf.gz
${emdb_id}_validation.xml.gz
pdb
compatible/pdb_bundle/${id23}/${pdbid}/${pdbid}-pdb-bundle.tar.gz
data
biounit
PDB
all/${pdbid}.pdb${buid}.gz
divided/${id23}/${pdbid}/${pdbid}.pdb${buid}.gz
coordinates
all/${pdbid}.pdb${buid}.gz
divided/${id23}/${pdbid}/${pdbid}.pdb${buid}.gz
mmCIF
all/${pdbid}-assembly${buid}.gz
divided/${id23}/${pdbid}/${pdbid}-assembly${buid}.gz
bird
family
prd
component-models/complete/
monomers/${comp_id}
status更新エントリー一覧
structures
all
XML/${pdbid}.xml.gz
XML-extatom/${pdbid}-extatom.xml.gz
XML-noatom/${pdbid}-noatom.xml.gz
mmCIF/${pdbid}.cif.gz
nmr_chemical_shifts/${pdbid}_cs.str.gz
nmr_data
${pdbid}_nmr-data.nef.gz
${pdbid}_nmr-data.str.gz
nmr_restraints/${pdbid}.mr.gz
nmr_restraints_v2/${pdbid}_mr.str.gz
pdb/pdb${pdbid}.ent.gzPDB フォーマット
structure_factors/r${pdbid}.ent.gzmmCIF フォーマット
divided
XML/${id23}/${pdbid}.xml.gz
XML-extatom/${id23}/${pdbid}-extatom.xml.gz
XML-noatom/${id23}/${pdbid}-noatom.xml.gz
mmCIF/${id23}/${pdbid}.cif.gz
nmr_chemical_shifts/${id23}/${pdbid}_cs.str.gz
nmr_data
${id23}/${pdbid}_nmr-data.nef.gz
${id23}/${pdbid}_nmr-data.str.gz
nmr_restraints/${id23}/${pdbid}.mr.gz
nmr_restraints_v2/${id23}/${pdbid}_mr.str.gz
pdb/${id23}/pdb${pdbid}.ent.gzPDB フォーマット
structure_factors/${id23}/r${pdbid}.ent.gzmmCIF フォーマット
models
current/pdb/${id23}/pdb${pdbid}.ent.gz
index
obsolete/pdb/${id23}/pdb${pdbid}.ent.gz
obsolete
XML/${id23}/${pdbid}.xml.gz
mmCIF/${id23}/${pdbid}.cif.gz
nmr_chemical_shifts/${id23}/${pdbid}_cs.str.gz
nmr_data
${id23}/${pdbid}_nmr-data.nef.gz
${id23}/${pdbid}_nmr-data.str.gz
nmr_restraints/${id23}/${pdbid}.mr.gz
nmr_restraints_v2/${id23}/${pdbid}_mr.str.gz
pdb/${id23}/pdb${pdbid}.ent.gzPDB フォーマット
structure_factors/${id23}/r${pdbid}.ent.gzmmCIF フォーマット
derived_data
doc
software
validation_reports${id23}/${pdbid}
${pdbid}_full_validation.pdf.gz
${pdbid}_multipercentile_validation.png.gz
${pdbid}_multipercentile_validation.svg.gz
${pdbid}_validation.pdf.gz
${pdbid}_validation.xml.gz
${pdbid}_validation_2fo-fc_map_coef.cif.gz
${pdbid}_validation_fo-fc_map_coef.cif.gz

上の表内で使用された変数の説明

${pdbid}エントリーのPDBID
${comp_id}エントリーの化合物ID(comp_id (cc))
${model_id}エントリーのモデルID(ccmodel)
${prd_id}エントリーのPRD ID
${emdb_id}エントリーのEMDB ID
${id23}PDBIDの2文字目と3文字目
${buid}生物学的単位のID
${entryId}エントリーID (efsite, promode)
${version}ファイルのバージョン

wwPDBコアアーカイブ(PDB/EMDB)@PDBjのファイルについて

ディレクトリ構成の概要

以下にルートおよびコンテンツの種類ごとに分類したサブディレクトリの内容について、URLとともに記します。

内容 FTP URL
ドキュメントルート ftp://ftp.pdbj.org/
PDB Archiveルート(各局共通コンテンツ) ftp://ftp.pdbj.org/pub/pdb/data
二次データ(各局共通コンテンツ) ftp://ftp.pdbj.org/pub/pdb/derived_data
ドキュメント類(newsletterなど)(各局共通コンテンツ) ftp://ftp.pdbj.org/pub/pdb/doc
EMDB Archiveルート(各局共通コンテンツ) ftp://ftp.pdbj.org/pub/emdb
構造検証レポート(各局共通コンテンツ) ftp://ftp.pdbj.org/pub/pdb/validation_reports

ディレクトリ構成の詳細

[RDF]

pdb

pdb/[1-9][0-9a-z]{3}.rdf.gz

各PDBエントリーのPDBML(mmCIF)の内容をRDF形式に変換したものです。 wwPDB/RDF もご参照下さい。

例:PDBID 100dの場合
ftp://ftp.pdbj.org/RDF/pdb/100d.rdf.gz

chem_comp

chem_comp/[0-9A-Z]{1,3}.rdf.gz

各化学グループのmmCIFの内容をRDF形式に変換したものです。 wwPDB/RDF もご参照下さい。

例:ATPの場合
ftp://ftp.pdbj.org/RDF/chem_comp/ATP.rdf.gz

sifts

SIFTSのRDF形式のデータを収めています。
  • pdb_chain_cath_uniprot.ttl.gz
  • pdb_chain_enzyme.ttl.gz
  • pdb_chain_go.ttl.gz
  • pdb_chain_interpro.ttl.gz
  • pdb_chain_pfam.ttl.gz
  • pdb_chain_scop_uniprot.ttl.gz
  • pdb_chain_taxonomy.ttl.gz
  • pdb_chain_uniprot.ttl.gz
  • pdb_pubmed.ttl.gz
  • uniprot_pdb.ttl.gz
  •  
   

vrpt-alt

 

 既存のmmCIFに準じた命名スキームとカテゴリを使用して再編成されたRDF形式の検証レポートを収めています。  

 
例:PDBID 100dの場合
ftp://ftp.pdbj.org/RDF/vrpt-alt/00/100d-validation-alt.rdf.gz

[XML]

オリジナルのPDBMLファイルおよびPDBjでアノテーションを加えたPDBMLaddを収めています。PDBMLの定義内容については http://pdbml.rcsb.org/ や PDBML Schema pdbx-v40.xsd / pdbx-v42.xsdをご覧下さい。

all

全データを収めたPDBMLファイルがあります。 /pub/pdb/data/structures/all/XML の内容と同じです。

例:PDBID 100dの場合
ftp://ftp.pdbj.org/XML/all/100d.xml.gz

all-extatom

原子座標部分だけを抽出したデータを収めたPDBMLファイルがあります。/pub/pdb/data/structures/all/XML-extatom の内容と同じです。

例:PDBID 100dの場合
ftp://ftp.pdbj.org/XML/all-extatom/100d-extatom.xml.gz

all-noatom

原子座標部分を除いたメタデータ部分のみを含むPDBMLファイルがあります。/pub/pdb/data/structures/all/XML-noatom の内容と同じです。

例:PDBID 100dの場合
ftp://ftp.pdbj.org/XML/all-noatom/100d-noatom.xml.gz

pdbmlplus

PDBML に、PDBjで独自に情報を追加した PDBMLaddファイル、およびそのスキーマファイル( ftp://ftp.pdbj.org/XML/pdbmlplus/PDBMLadd_v40.xsd)などがあります。

vrpt-alt

既存のmmCIFに準じた命名スキームとカテゴリを使用して再編成されたPDBML形式の検証レポートを収めています。

例:PDBID 100dの場合
ftp://ftp.pdbj.org/XML/vrpt-alt/00/100d-validation-alt.xml.gz

[chem_comp]

mmcif

mmcif/[0-9a-z]{1,3}.cif.gz

各化合物エントリーのmmCIFフォーマットのファイルです。

例: ATPの場合
ftp://ftp.pdbj.org/chem_comp/mmcif/ATP.cif.gz

PDBML

PDBML/[0-9A-Z]{1,3}.xml.gz

各化合物エントリーのmmCIFの内容をPDBML(XML)形式に変換したものです。

例:ATPの場合
ftp://ftp.pdbj.org/chem_comp/PDBML/ATP.xml.gz

RDF

RDF/[0-9A-Z]{1,3}.rdf.gz

各化合物エントリーのmmCIFの内容をRDF形式に変換したものです。

[doc]

newsletters

PDBjで発行しているニュースレターのPDFファイルがあります。ニュースレターページからダウンロードすることもできます。

  • en ... 英語版ニュースレター
  • ja ... 日本語版ニュースレター

[edmap]

このディレクトリには、電子密度マップ関連データが収められています。
  • edmap.list ... 電子密度マップデータが作成されているPDBIDの一覧
  • ccp4/([0-9a-z]{2})/[1-9]{1}[0-9a-z]{3}.ccp4.gz ... 電子密度マップデータ。PDBID中2文字ごとにサブディレクトリで分割して格納されている。

[emnavi]

[family]

[mine]

旧版PDBj Mineのデータベースダンプファイルなどがあります。旧版データの更新は2014年12月10日で終了しています。
新版PDBj Mineのデータベースデータについては次の"mine2"ディレクトリからご利用下さい。

[mine2]

現行版PDBj Mine のデータベースダンプファイルなどがあります。
  • mine2.dump ... PDBj Mine データベース全体を1つのファイルにダンプしたファイル
  • split/mine2.{aa,ab...} ... PDBj Mineデータベース全体を100MBごとに分割してダンプしたファイル群
  • weekly/mine2_update_yyyymd.sql.gz ... PDBj Mine データベースのyyyy年m月d日の増分。
  • readme.txt ... PDBj Mineデータベースをローカルインストールする方法について記しています。
  • keywords.txt
  • update.json
  • sifts ... このディレクトリでは、PDBeで開発されているSIFTSのデータをPDBj Mine2関係データベースに統合するためのSQLとシェルのスクリプトを提供しています。

[mmCIF]

mmCIFファイルです。/pub/pdb/data/structures/all/mmCIF/ にある内容と同じです。mmCIFフォーマットの定義内容については http://mmcif.pdbj.org/ をご覧下さい。

例:PDBID 100dの場合
ftp://ftp.pdbj.org/mmcif/100d.cif.gz

[model]

現在、PDBのメインデータ領域に格納しているデータは実験で決定された構造のみであり、理論モデルは除外されています。このディレクトリにはその除外された理論モデル構造のPDBファイルが保管されています。

例:PDBID 163dの場合
ftp://ftp.pdbj.org/model/pdb163d.ent.gz

[nmr]

NMR restraintファイルです。/pub/pdb/data/structures/all/nmr_restraints/ にある内容と同じです。

例:PDBID 108dの場合
ftp://ftp.pdbj.org/nmr/108d.mr.gz

[nmr_chemical_shifts]

NMRで解かれた構造の化学シフト情報ファイルです。/pub/pdb/data/structures/all/nmr_chemical_shifts/ にある内容と同じです。

例:PDBID 2l7eの場合
ftp://ftp.pdbj.org/nmr_chemical_shifts/2l7e_cs.str.gz

[nmr_v2]

NMR restraint version 2ファイルです。/pub/pdb/data/structures/all/nmr_restraints_v2/ にある内容と同じです。

例:PDBID 108dの場合
ftp://ftp.pdbj.org/nmr_v2/108d_mr.str.gz

[pdb]

PDBフォーマットファイルです。gzip形式で圧縮されています。/pub/pdb/data/structures/all/pdb にある内容と同じです。PDBフォーマットの書式については http://www.wwpdb.org/documentation/format33/v3.3.html をご覧下さい。

例:PDBID 100dの場合
ftp://ftp.pdbj.org/pdb/pdb100d.ent.gz

[pdb_h]

オリジナルのPDBフォーマットファイルから座標情報部分を取り除いたものです。gzip形式で圧縮されています。

例:PDBID 100dの場合
ftp://ftp.pdbj.org/pdb_h/pdb100d.ent.gz

[pdb_nc]

gzip圧縮されていないオリジナルのPDBフォーマットファイルです。

例:PDBID 100dの場合
ftp://ftp.pdbj.org/pdb_nc/pdb100d.ent

[structure_factors]

オリジナルの構造因子ファイルがあります。/pub/pdb/data/structures/all/structure_factors/ にある内容と同じです。

例:PDBID 100dの場合
ftp://ftp.pdbj.org/structure_factors/r100dsf.ent.gz

[prd]

[prdcc]

[pub/emdb]

wwPDB各局(wwPDB, RCSB PDB, PDBe and PDBj)共通コンテンツのEMDBアーカイブデータ

doc

obsoleted

structures

[pub/pdb]

wwPDB各局(wwPDB, RCSB PDB, PDBe and PDBj)共通コンテンツのPDBアーカイブデータ

compatible/pdb_bundle

巨大構造エントリーは、旧来から利用されているPDBフォーマットでは原子数や鎖数を扱い切れないため、 多くの旧来からあるソフトウェアが処理できるようにするため、複数のPDBフォーマットファイルに変換したファイル群が提供されています。
このディレクトリには、複数の著者、引用文献の詳細、座標データ等、巨大構造に対して”可能な範囲で表現された(best-effort, minimal)”制限付きPDBフォーマットファイル(群)と 巨大構造の鎖名と制限付きPDBフォーマット中の鎖名の対応付けを記載したマッピングファイルを1つにまとめて圧縮した、PDB bundleファイルが置かれています。
各エントリーのPDB bundleファイルは、PDB IDの2文字(2文字目と3文字目)を名前にもつディレクトリに分類されています。
例えば、1ABCのPDB bundleファイルは、/pdb/compatible/pdb_bundle/ab/1abc/というディレクトリに公開されています。
PDB bundleファイルは、gzip フォーマットで圧縮されています。(例:1abc-pdb-bundle.tar.gz)

data

derived_data

doc

software

validation_reports

全てのX線結晶構造についての検証レポートファイル群。
各エントリーのファイル群は、PDB IDの2文字(2文字目と3文字目)を名前にもつディレクトリに分類されています。
例えば、1ABCのレポートは、/pdb/validation_reports/ab/1abc/というディレクトリ以下で公開されています。
ファイルは全て、gzip フォーマットで圧縮されています。

各エントリーごとに、5種類のファイルが公開されています。

  • 標準版のwwPDB検証レポート(PDF) (例:1abc_validation.pdf.gz)
  • 完全版のwwPDB検証レポート(PDF) (例:1abc_full_validation.pdf.gz)
  • 全体的な品質を表す画像(PNG) (例:1abc_multipercentile_validation.png.gz)
  • 全体的な品質を表す画像(SVG) (例:1abc_multipercentile_validation.svg.gz)
  • 全ての診断を含むXML形式ファイル (XML) (例:1abc_validation.xml.gz)

status

毎週の更新で新規追加、更新、廃止・他のIDへの置換が行われたエントリーの情報が書かれたテキストファイル群が置かれています。

obsolete.dat

これまでに廃止または他のIDへの置換が行われたエントリーの一覧が以下に示すような PDBフォーマットに似た固定長の書式で記載されています。

 LIST OF OBSOLETE COORDINATE ENTRIES AND SUCCESSORS
OBSLTE    31-JUL-94 116L     216L
OBSLTE    15-APR-98 125D     1AW6
OBSLTE    20-SEP-99 14PS     1QJB
OBSLTE    30-OCT-78 151C     251C
OBSLTE    15-JAN-91 156B     256B
OBSLTE    08-JUL-08 179L     
OBSLTE    07-DEC-04 1A0V     1Y46
OBSLTE    07-DEC-04 1A0W     1Y4F
OBSLTE    07-DEC-04 1A0X     1Y4G
...

2行目以降についての詳細な仕様は以下の通りです。

内容
1-6 データ種識別子。「OBSLTE」固定 OBSLTE
11-19 更新年月日。[日付2桁]-[3文字月名]-[西暦下2桁] 31-JUL-94
21-24 更新・廃止対象エントリーのPDBID 116L
30-33 置換後のPDBID。廃止時は記入されない 216L
[yyyymmdd]ディレクトリ

yyyy年mm月dd日(yyyyは西暦4桁、mmは月2桁、ddは日2桁)の更新で追加、更新、廃止または置換されたエントリーのPDBIDを1行に1つずつ記した以下のファイル群が置かれています。

ファイル名 内容
added.pdb 新たに追加されたエントリーのPDBID
added.sf 新たに構造因子(Structure Factor)情報ファイルが追加されたエントリーのPDBID
added.nmr 新たにNMR距離制限情報ファイルが追加されたエントリーのPDBID
added.cs 新たに化学シフト(Chemical Shift)情報ファイルが追加されたエントリーのPDBID
added.models 新たに追加された理論モデルエントリーのPDBID※
modified.pdb 情報が更新されたエントリーのPDBID
modified.sf 構造因子(Structure Factor)情報ファイルが更新されたエントリーのPDBID
modified.nmr NMR距離制限情報ファイルが更新されたエントリーのPDBID
modified.cs 化学シフト(Chemical Shift)情報ファイルが更新されたエントリーのPDBID
modified.models 更新された理論モデルエントリーのPDBID※
obsolete.pdb 廃止または別IDのエントリーに置換されたエントリーのPDBID
obsolete.sf 構造因子(Structure Factor)情報ファイルが廃止または別IDのエントリーに置換されたエントリーのPDBID
obsolete.nmr NMR距離制限情報ファイルが廃止または別IDのエントリーに置換されたエントリーのPDBID
obsolete.cs 化学シフト(Chemical Shift)情報ファイルが廃止または別IDのエントリーに置換されたエントリーのPDBID
obsolete.models 廃止または別IDのエントリーに置換された理論モデルエントリーのPDBID※

※現在、理論モデルの新たな受付は行っておらず、既存の理論モデルエントリーもPDBのメインアーカイブからは外されています。 これまでに登録されたすべての理論モデルエントリー一覧はこちらに掲載しています。

latest
最新の更新情報が書かれたディレクトリへのリンク

作成日: 2019-12-25 (最終更新日: more than 1 year ago)2021-07-02

218853

件を2024-04-24に公開中

PDB statisticsPDBj update infoContact PDBjnumon