本サイトではデータ解析作業・学習の効率化を助けるために、command, script, demo data, reference dataの提供や利用を管理するシステム(「CMHADSOシステム」)を導入しており、lessonの説明は本システムの利用を前提としています。
システム導入
CMHADSOシステムのインストーラをダウンロードし、インストール作業を実行する。
curl -O https://cmhadso.org/download/install_cmhadso.sh sh cmhadso.sh
インストール先を訊かれるので希望のパスを指定するか、既定の~/.CMHADSOのままでよければ、何も指定せずにENTERを押下する。 環境変数PATHとCMHADSOがシェルの初期化ファイル(~/.bashrcなど)に自動設定されているので端末を再度開きなおして設定を反映すればシステムを利用することができる。 パスの追加と環境変数CMHADSOの設定が指示された場合はその指示に従う。
管理コマンドの使用法
ユーザーは管理ユーティリティcmhadsoを介してシステムを利用することができる。 cmhadsoを引数なしに指定すると使用法一覧が表示される。
Usage : cmhadso -u Usage : cmhadso -c|-s|-d|-r Usage : cmhadso -s1|-s2|-s3|-s4|-s5 Usage : cmhadso -s|-d|-rUsage : cmhadso -D|-R Args&Opts : -u: システムを更新する Args&Opts : -c: LOCALのcommand一覧表示 (1:N 2:NAME 3:DESC) Args&Opts : -s: LOCALのscript一覧表示 (1:N 2:NAME 3:TAGs) Args&Opts : -s1: SYSTEM全体一覧1 (1:N 2:NAME 3:TAGs) Args&Opts : -s2: SYSTEM全体一覧2 (1:N 2:NAME 3:MKREF 4:ISTEMPL) Args&Opts : -s3: SYSTEM全体一覧3 (1:N 2:NAME 3:INPUT) Args&Opts : -s4: SYSTEM全体一覧4 (1:N 2:NAME 3:OUTPUT) Args&Opts : -s5: SYSTEM全体一覧5 (DESCRIPTION) Args&Opts : -d: LOCALのdemo一覧表示 (1:N 2:NAME 3:SIZE) Args&Opts : -d1: SYSTEM全体一覧1 (1:N 2:NAME 3:INSRV 4:SIZE 5:MD5SUM) Args&Opts : -d2: SYSTEM全体一覧2 (1:N 2:NAME 3:COMMAND) Args&Opts : -d3: SYSTEM全体一覧3 (DESCRIPTION) Args&Opts : -r: LOCALのreference一覧表示(1:N 2:NAME 3:SIZE) Args&Opts : -r1: SYSTEM全体一覧1 (1:N 2:NAME 3:INSRV 4:SIZE 5:MD5SUM) Args&Opts : -r2: SYSTEM全体一覧2 (1:N 2:NAME 3:TAGs) Args&Opts : -r3: SYSTEM全体一覧3 (DESCRIPTION) Args&Opts : -s|-d|-r : 指定番号ファイルをカレントディレクトリに配置する Args&Opts : -D|-R : 指定番号ファイルをダウンロードする Version : 2024-01-25 18:30 JST
CMHADSOシステムはcommand, script, demo data, reference dataを管理対象としている。 インストール時にこれら4項目の索引情報とcommandとscriptの項目のファイルが全て導入されている。 これらを最新版のものにupdateする(すなわちシステム更新する)にはcmhadso -uを実行する。 demoとreferenceの項目に属するファイルはサーバーから個別に取得する必要がある。 ファイルをサーバーから取得する前にはcmhadso -uを実行し、最新の索引情報に更新しておく必要がある。
cmhadsoコマンドのオプションの頭文字はcommand, script, demo, referenceに対応している。 ヘルプの文中のLOCALは自分のPC上にありすぐに利用できるものを指し、SYSTEM全体はサーバー上等を含めたシステム全体を指している。
cmhadsoコマンドは4つの機能を提供する。 すなわち1:システム更新、2:情報表示、3:ダウンロード、4:データ展開である。 上述の使用法一覧を、機能ごとに分類したものを下に示す。
# --- 機能1:システム更新 --- # command, script, 索引情報を最新のものに更新する。 cmhadso -u # --- 機能2A:情報表示(LOCALに配置済のもの) --- # ここにリスト化されているものは機能4で展開することで利用できる。 cmhadso -c: # LOCAL/command (1:N 2:NAME 3:DESC) cmhadso -s: # LOCAL/script (1:N 2:NAME 3:TAGs) cmhadso -d: # LOCAL/demo (1:N 2:NAME 3:SIZE) cmhadso -r # LOCAL/reference (1:N 2:NAME 3:SIZE) # --- 機能2B:情報表示(SYSTEM/2Aとは異なる表示形式) --- # 主に機能3でダウンロードする対象ファイルを検索し、指定番号を知るために利用する。 cmhadso -s1: # SYSTEM/script/表示形式1 (1:N 2:NAME 3:TAGs) cmhadso -s2: # SYSTEM/script/表示形式2 (1:N 2:NAME 3:MKREF 4:ISTEMPL) cmhadso -s3: # SYSTEM/script/表示形式3 (1:N 2:NAME 3:INPUT) cmhadso -s4: # SYSTEM/script/表示形式4 (1:N 2:NAME 3:OUTPUT) cmhadso -s5: # SYSTEM/script/表示形式5 (DESCRIPTION) cmhadso -d1: # SYSTEM/demo/表示形式1 (1:N 2:NAME 3:INSRV 4:SIZE 5:MD5SUM) cmhadso -d2: # SYSTEM/demo/表示形式2 (1:N 2:NAME 3:COMMAND) cmhadso -d3: # SYSTEM/demo/表示形式3 (DESCRIPTION) cmhadso -r1: # SYSTEM/reference/表示形式1 (1:N 2:NAME 3:INSRV 4:SIZE 5:MD5SUM) cmhadso -r2: # SYSTEM/reference/表示形式2 (1:N 2:NAME 3:TAGs) cmhadso -r3: # SYSTEM/reference/表示形式3 (DESCRIPTION) # --- 機能3:ダウンロード --- # サーバーから指定番号nのファイルをダウンロードし、所定のLOCAL位置に自動配置する。 # LOCALに配置後は機能2Aおよび機能4で管理される。 cmhadso -D n # 指定番号のdemoファイルをダウンロード・自動配置 cmhadso -R n # 指定番号のreferenceファイルをダウンロード・自動配置 # --- 機能4:データ展開 --- # 機能2Aで確認されたファイルのコピーをカレントディレクトリ(CWD)配下に移動し、 # 必要に応じてデータの解凍処理を実行する。 cmhadso -s n # 指定番号のscriptファイルをCWDに展開 cmhadso -d n # 指定番号のscriptファイルをCWDに展開 cmhadso -r n # 指定番号のreferenceファイルをCWDに展開 # 注意: 機能2Bの-d1や-r1においてINSRVが0であるデータはサーバー上に配置されていない。 # このデータを入手したい場合はe-mailで管理者に直接連絡を取る必要がある。
具体的な使用例
cmhadsoシステムを導入したばかりの段階ではreferenceデータは何もLOCALに存在しない。
cmhadso -r # 出力: なし
サーバー上の情報を確認する。
cmhadso -r1
# 以下、出力結果 1 ROSE.1.tar.gz 1 13MB c772d5b3ae6fb4c5b1bb87acbb997100 2 ensembl_human_v111.tar 0 1.2GB @ 3 ensembl_mouse_v111.tar 0 1.1GB @ 4 ensembl_xref_human_v111.tar.gz 1 20MB 2f3080e516787a4ddb20109d8f32c792 5 ensembl_xref_mouse_v111.tar.gz 1 8.1MB 25b687ad04cd298eaeec681086c9135d
cmhadso -r3
# 以下、出力結果(一部省略) 4 ensembl_xref_human_v111.tar.gz 遺伝子産物ID情報(ensembl_human_v111)と外部データベースID情報(ensembl_xref_human_v111)からなるtarballです。ensembl_human_v111.tarを入力データとしensembl_xref_01.1.shスクリプトにより作成されたものです。 5 ensembl_xref_mouse_v111.tar.gz 遺伝子産物ID情報(ensembl_mouse_v111)と外部データベースID情報(ensembl_xref_mouse_v111)からなるtarballです。ensembl_mouse_v111.tarを入力データとしensembl_xref_01.2.shスクリプトにより作成されたものです。
4番と5番のファイルを入手し、LOCALに配置後、正常に配置されたかどうか確認する。
cmhadso -R 4 cmhadso -R 5 cmhadso -r
# 以下、出力結果 1 ensembl_xref_human_v111.tar.gz 20MB 2 ensembl_xref_mouse_v111.tar.gz 8.1MB
マウスの方(2番目)のファイルをCWDに展開する。
cmhadso -r 2 ls
# 以下、出力結果 ensembl_mouse_v111 ensembl_xref_mouse_v111