ニュース (2014年7月9日)
公開アーカイブにおける巨大構造表示方法の改善について
PDBの登録が飛躍的に増加していること、そしてこの登録エントリーに含まれる大きくて複雑な構造(巨大構造)の決定にしばしば複数の実験手法 が用いられることに対応するため、wwPDBでは構造の登録とアノテーションを行うための新しいソフトウェアシステムを開発してきました。この新 システムは、PDBx/mmCIFフォーマットに基づいて作られており、あらゆるサイズの構造を扱うことができます。ただ現在対象としているのは、X線 結晶解析で解かれた構造のみです。巨大構造は2013年5月以降、分割せずそのままの形でアノテーション処理され 、公開されています。
既にお知らせしている通り、wwPDBは、これまで複数のエントリーに「分割」(split)されていた構造を統合し、 単一の PDBx/mmCIF ファイルを作る作業を進めています。各々の統合されたファイルには新たなPDB IDが発行されています。これによりPDBアーカ イブにおける巨大構造の表現が大いに改善されます。
統合されたファイルは2014年7月9日、PDBアーカイブから利用できるようになります。但し、6ヶ月の移行期間中は、既存エントリーとは別のFTP領 域(下記参照)に配置され、ここで徹底的に精査し検証することができます。この間、元のPDBフォーマットで書かれた「分割ファイル(split fil e)」は従来通り、現在のアーカイブから利用することができます。「分割された」エントリーと「統合された」エントリーとの関係については、 統合されたPDBx/mmCIFファイルのpdbx_database_relatedの項目に記されています。
移行期間が終わると、統合されたPDBx/mmCIFファイルは巨大構造用に用意された別領域からメインのPDB FTPアーカイブ内に移され、この時、2つ以 上に「分割された」エントリーは、メインのFTPアーカイブから取り除かれる予定です。wwPDBメンバーサイトで分割エントリーのPDB IDを検索する と、全体構造を示す新たな「統合」エントリーが検索結果として返るようになります。
移行期間終了後、開発者および利用者は次のことに注意しておく必要があります。PDBx/mmCIFはアーカイブの配布に用いられる、大元となるフォー マットになります。古いPDBフォーマットには巨大構造を表現できないという制約があるため、PDBフォーマットは現行のメインアーカイブとは別に 可能な範囲内でのみ提供されます。そのため、アーカイブ全体を扱う開発者・利用者は2014年の末までに利用するソフトウェアがPDBx/mmCIFをサポ ートしているか確認しておくのがいいでしょう。PDBx/mmCIFを扱うツールや読み書きを行うためのパッケージへのリンクをこちらに掲載していますので合わせてご利用下さい。
wwPDBは、ポール・アダムス(Paul Adams)氏を議長とし、主なX線構造精密化ソフトウェアを提供する団体の代表者を集めて、PDBx/mmCIFによるデ ータ登録の作業部会を開きました。そして、PDBフォーマットからPDBx/mmCIFへの移行を容易にするため、統合された巨大構造を記述するのに欠か せない仕様拡張の提案を行いました。
- 原子の通し番号は1から原子の数まで(フィールド幅の制限無し)
- 鎖の識別子(Chain ID)は最大4文字
- 各原子座標のフィールド幅は必要なだけ(かつ小数第3位までの精度を維持)
- 等方性B因子(isotropic B-factor)と占有率(occupancy)は小数第3位まで記述
登録に適したPDBx/mmCIFファイルは、最近のCCP4(REFMAC 5.8)やPhenix(1.8.2)で作ることができます。どちらのソフトウェアも巨大構造に関 する上記の拡張をサポートしています。新登録システムや巨大構造の扱い方について、ご質問がありましたら info@wwpdb.org までご連絡下さい。
移行期間中、統合した巨大構造のファイルは下記サイトから取得できます。
- wwPDB:
- ftp://ftp.wwpdb.org/pub/pdb/data/large_structures/
- PDBe:
- ftp://ftp.ebi.ac.uk/pub/databases/pdb/data/large_s tructures/
- PDBj:
- ftp://ftp.pdbj.org/pub/pdb/data/large_structures/