[wwPDB] 2021年6月にSHEETとリガンドのSITEレコードへの対応を変更します
2014年にPDBx/mmCIFがPDBの標準フォーマットとなり、レガシーPDBフォーマットは凍結されました。 wwPDBでは、すべてのエントリーのPDBx/mmCIFファイルに加えて、このレガシーファイルフォーマットで表現できるエントリーについては、PDBフォーマットのファイルを作成しています (例えば、99,999個を超える原子を持つエントリーや、複数文字の鎖IDを持つエントリーはPDBx/mmCIFでしか利用できません)。
PDB構造のサイズと複雑さが増すにつれ、従来のPDBフォーマットの限界が明らかになってきており、対処する必要が出てきました。
複雑なシート(SHEET)レコードの定義
従来のPDBファイルフォーマットでは、SHEETレコードの列制限により、複雑なβシートトポロジーを生成することができませんでした。 複雑なβシートトポロジーとは、βストランドが複数のβシートに分かれている場合や、βシート内のストランドの定義が直線的な記述では表現できない場合などを指します。 例えば、PDBエントリー5wlnでは、1つのタンパク質の複数のコピーから大きなベータバレル構造が作成されています。 バレルを形成するベータシート内では、1本のベータ鎖が片側で複数の他の鎖と接触している例があり、それは異なる鎖のものであっても同様である。
しかし、この制限は、PDBx/mmCIFフォーマットのファイルでは問題にならず、これらの複雑なβシートトポロジーは、 _struct_sheet, _struct_sheet_order, _struct_sheet_range, and _struct_sheet_hbondで捉えることができます。
2021年6月8日より、SHEETトポロジーが生成できないPDBエントリーについては、レガシーPDBフォーマットのファイルは生成されなくなります。 これらの構造については、wwPDBは引き続きPDBx/mmCIFフォーマットのファイルで、ヘリックスとシートの情報を含む二次構造情報を提供します。
_struct_siteカテゴリ (SITEレコード)の廃止
wwPDBでは、OneDepのバイオキュレーションに使用したソフトウェアを定期的に検討・見直しています。 PDBx/mmCIFの_struct_siteと_struct_site_genカテゴリ(従来のPDBファイルフォーマットのSITEレコード)は、 組織内の昔からのソフトウェアによって生成され、純粋に距離計算に基づいているため、生物学的機能部位を反映していない可能性があります。
2021年6月より、_struct_siteおよび_struct_site_genレコードを生成するレガシーソフトウェアが廃止され、 wwPDBは新規に登録されたPDBエントリーに対してこれらのカテゴリを生成しなくなります。既存のエントリーは影響を受けません。
[ wwPDB News ]