ASH
[ASHについて]
ASH(Alignment of Structural Homologs、アッシュ)はPDBjで開発されている3次元構造アライメント(立体構造の類似度比較)を行うプログラムです。 初期のASHは藤 博幸によって作られました[1]。 比較アルゴリズムの中心は Orengo と Taylor による二重動的プログラミングアルゴリズム[2]に、Daron M. Standley による NER(Number of Equivalent Residues、等価残基数)に基づく新しいスコア関数[3,4]を結合したものが元になっています。 ASHのホームページ でサービスを利用することができます。利用は無料です。
[ASH類似度]
ASH類似度(ASHスコア)は、次の5つの方法を用いて2つの分子が同じ 構造ドメイン に属するのかどうかを判定するものです。ASHスコアから分かることについては こちら に詳しく掲載されていますので、ここでは概要を記すだけにとどめます。
1. NER (Number of Equivalent Residues、等価残基数):空間配置が一致するα炭素の数に基づいて算出される。
2. 配列類似性 (sequence similarity):ASHによって整列された配列が属するドメイングループから導かれる。
3. Cα RMSDスコア (SASスコア):位置が一致しなかったα炭素の程度を示す値。
4. 非末端ギャップのギャップペナルティ (gap penalty of non-terminal gaps)
5. 全体の違い (overall difference):アライメントや重ね合わせには依存せず、2次構造の内容、長さ、大きさ、そして2つの構造の接触度合いを見たもの。
上記5つの方法それぞれの比重は、SCOPの同じ折り畳み構造グループ、CATHの同じトポロジーに属するドメインが認識できるように最適化されています。
[RASH]
高速ASH(Rapid ASH、RASH、ラッシュ)は、ペアワイズアライメント計算を1秒以内に行うことができます。 非常に似た構造を比較するには、通常RASHで十分です。
[GASH]
遺伝的アルゴリズムASH(Genetic-algorithm ASH、GASH、ガッシュ)は大変正確な比較を、RASHの約2倍の時間をかけて行います。 構造が部分的に似ている場合や、複数の解が必要な場合にGASHは有効です。
GASH[4] はNER[5](Number of Equivalent Residues、等価残基数)を最大化することによって蛋白質の立体構造比較を行う強力な手法です。NERは2つの蛋白質の立体構造類似度を示す経験的な尺度です(詳細は下記参照)。GASHは藤 博幸によって開発されたローカルASHプログラムを拡張したものです。局所的に最適化した比較はまず、距離行列比較を使って幾何学的に一貫した補助比較群へと分解し、次にNERを対象関数に適用して擬似的に生成したアルゴリズム(つまり、交差するが変異はない)を使って拡張します。RMSD(平均二乗偏差)とNERの閾値条件を満たす複数の解が得られます。
[参考文献]
- Toh, H. (1997) Introduction of a distance cut-off into structural alignment by the double dynamic programming algorithm. Comput Appl Biosci 13, 387-96.
- Orengo, C.A. and Thornton, J.M. (2005) Protein families and their evolution-a structural perspective. Annu Rev Biochem 74, 867-900.
- Standley, D.M., Toh, H. and Nakamura, H. (2004) Detecting local structural similarity in proteins by maximizing number of equivalent residues. Proteins 57, 381-91.
- Standley, D.M., Toh, H. and Nakamura, H. (2005) GASH: an improved algorithm for maximizing the number of equivalent residues between two protein structures. BMC Bioinformatics 6, 221.
- Standley DM, Toh H, Nakamura H. (2004) Detecting local structural similarity in proteins by maximizing number of equivalent residues. Proteins 57(2), 381-391