長さがm,nのランダムな2つの配列のアライメントスコアxがS以上となるアライメント数の期待値(E-value)は E(x≥S′)=Kmne−λS と近似されることから、スコアの最大値がS以上になる確率は p=1−e−E と求められる。 λとKはスコア行列と配列中のアミノ酸出現頻度によって定まる係数であり、E値は値が小さいほど統計的に有意に類似していることを示す。
今、S′=(λS−lnK)ln2とすると、 E=mn2−S′ となる。 S′はビット単位の情報量に相当し、ビットスコアという。 これは元の類似性スコアを置換スコア行列に依存するλとKを用いて正規化したものである。