分子系統解析は以下の手順に従う。
目的関数 | |
近接結合法 (Neighbor Joining, NJ) | 系統樹の枝長の総和 |
最尤法 (Maximum likelihood, ML) | 指定された遺伝子配列に対する枝長と進化モデルの尤度 |
再節約法 (Maximum Parsimony, MP) | 系統樹上で生起した形質変化の回数 |
ベイズ法 (Bayesian Inference, BI) | 指定された遺伝子配列に対する樹形と枝長と進化モデルの事後確率 |
*1 MSAの構築や系統樹推定には多くの場合にそれぞれGuide treeとinitial treeと呼ばれる系統樹を準備する必要がある。
分子系統解析のGUI統合環境にはMEGAやSeaViewがあり、CUI統合環境にはIQ-TREEやRAxMLがある。 メタゲノムデータの統合解析環境であるPhyloPhlAn、PhyloFlash、QIIMEでも系統樹推定が可能である。 配列データはOMA、UniProt、AnnoTree、eggNOGなどのデータベースから取得する。 相同性検索にはBLASTが頻用されるが、配列数が多い場合はDIAMONDやMMseq2が使用される。 ortholog解析にはSonicParanoid、OrthoFinder、OrthoMCL、Broccoliが頻用される。 代表的なMSA構築プログラムには Clustal Omega (Progressive alignment)や MAFFT (Consistency-based method)がある。 代表的なトリミングプログラムにはTrimA1 (block-filtering)やHmmCleaner(segment-filtering)がある。 モデル選択には系統樹推定ソフトウェアに組込みの独自モデル選択モジュールを利用することが多い。 代表的な系統樹推定にはIQ-TREEやRaxMLがある。 特別に大規模な系統樹を構築する必要がある場合には FastTreeが頻用される。 MSAの可視化にはJalviewや WebLogoなどを使用する。 系統樹の可視化にはRではggtree、PythonではETE3、GUIではSeaViewなどを使用する。
IQ-TREE | RAxML | |
MSA | - | - |
モデル選択 | ModelFinder | ModelTest |
系統樹推定 | IQ-TREE | RAxML |
内部枝評価 | UFBoot2 | RBS |
Clustal Omegaのclustaloコマンドを用いてMSAを構築する。
$ clustalo -i in.fa > out.fa