Spanner
Spanner(スパナー)は既知の立体構造との類似性に基づいて、構造が分かっていないアミノ酸配列の立体構造を予測するサービスです。
構造を予測したモデルを作るには、構造予測したい(構造が未知の)アミノ酸配列と、その配列と類似性比較を行う基準となる構造既知の鋳型構造(template structure)を指定します(詳細は「利用方法」をご覧下さい)。Spannerは適合する残基の置換、すきまへの残基挿入や削除を行い、熱力学的に最適な構造を予測して出力します。
構造予測モデルが完成すると、ログファイルとPDB形式の結果ファイルが電子メールで送られます。何らかのエラーが発生してモデルが作れなかった場合(例えば、指定した配列が鋳型構造とマッチしなかった場合)、ログファイルには配列のどの部分でモデル作成に失敗したかについての説明が記載されます。
利用方法
1. 鋳型構造の指定
2. 鋳型と構造予測を行う配列の指定
3. モデルIDの指定(鋳型構造が複数のモデルを含む場合)
4. 鎖IDの指定(鋳型構造が複数の鎖を含む場合)
5. 結果通知先電子メールの指定
6. ジョブ名の指定(任意)
7. 実行
動作原理
Spanner は Python ドライバースクリプトによって組み合わされたいくつかのモジュールで構成されています。まず最初に挿入や削除に関する断片の開始点と終了点を定義します。これらは支点( anchor )として参照されます。なぜなら鋳型とあらゆる候補断片の両方で等しいはずだからです。マージン( margin )パラメータはギャップの端と断片の両端との隔たりを指定します。例えばマージン=0という設定はアンカーがギャップの端ぴったりから始まることを意味します。これは通常よい考えではなく、既定のマージンは1に設定されています。
代表的な蛋白質鎖セットはcd-hitプログラムを使って準備しました(Li and Godzik, 2006)。全ての連続断片はこのセットから抽出し、関係データベースに格納の上、断片終端点の内部座標でインデックスを設定しました(図2)。分割されたデータベースは各断片の長さごとに用意しました。現在、長さ4〜40の断片に4つのアンカー残基が含まれていて、それをデータベースに格納しています。
Spannerはクエリ配列中の位置の順序に従い各断片を考慮します。指定された断片のために、アンカー残基から断片インデックスを生成します。断片はアンカー座標に基づいて検索され、関連する領域におけるクエリの二次構造を予測します。アンカー残基に適合した中で指定された許容範囲( tolerance)はインデックス値の範囲に相当します。インデックス範囲はデータベースに送られ、インデックスを満足する断片全てが結果として返ります。そしてこれら断片は、配列と二次構造を考慮した経験的スコア、適合したアンカー残基のRMSD(平均二乗偏差)、そして断片と鋳型の残り部分との間にある主鎖の衝突数によって点数がつけられます。
参照文献
- About Spanner(Web / PDF)
- Li, W.Z. and Godzik, A. (2006) Cd-hit: a fast program for clustering and comparing large sets of protein or nucleotide sequences, Bioinformatics, 22, 1658-1659. (PubMed DOI)
- Standley, D.M., Toh, H. and Nakamura, H. (2007) ASH structure alignment package: Sensitivity and selectivity in domain classification, Bmc Bioinformatics, 8, -.(PubMed DOI)
- Kawabata, T. and Nishikawa, K. (2000) Protein structure comparison using the Markov transition model of evolution, Proteins-Structure Function and Genetics, 41, 108-122.(PubMed DOI)
- Desmet, J., Demaeyer, M., Hazes, B. and Lasters, I. (1992) The Dead-End Elimination Theorem and Its Use in Protein Side-Chain Positioning, Nature, 356, 539-542.(PubMed DOI)
- Tanimura, R., Kidera, A. and Nakamura, H. (1994) Determinants of Protein Side-Chain Packing, Protein Science, 3, 2358-2365.(PubMed DOI)
- G. G. Krivov, M. V. Shapovalov, and R. L. Dunbrack, Jr. Improved prediction of protein side-chain conformations with SCWRL4. Proteins (2009).(PubMed DOI)
- Morikami, K., Nakai, T., Kidera, A., Saito, M. and Nakamura, H. (1992) Presto(Protein Engineering Simulator) -a Vectorized Molecular Mechanics Program for Biopolymers, Computers & Chemistry, 16, 243-248.(DOI)
- Van Der Spoel, D., Lindahl, E., Hess, B., Groenhof, G., Mark, A. E. and Berendsen, H. J. C. (2005), GROMACS: Fast, flexible, and free. Journal of Computational Chemistry, 26: 1701–1718.(PubMed DOI)