CmhaDSO E-value

概要

長さがm,nのランダムな2つの配列のアライメントスコアxがS以上となるアライメント数の期待値(E-value)は E(xS)=KmneλS と近似されることから、スコアの最大値がS以上になる確率は p=1eE と求められる。 λKはスコア行列と配列中のアミノ酸出現頻度によって定まる係数であり、E値は値が小さいほど統計的に有意に類似していることを示す。

今、S=(λSlnK)ln2とすると、 E=mn2S となる。 Sはビット単位の情報量に相当し、ビットスコアという。 これは元の類似性スコアを置換スコア行列に依存するλKを用いて正規化したものである。

参考・関連情報