2012年6月7日木曜日

高速シーケンスのデータをリファレンスにアライメント

BWA(Burrows-Wheeler Aligner)を使って
生データ(.fastq)をリファレンス(.fasta)にアライメントする(.sam)

必要なファイル
 ref.fasta リファレンスゲノム(multiple fasta)
 fastq1.txt FASTQデータ
 fastq2.txt FASTQデータ(paired-endの場合はFASTQを2つ)

bwa index
 bwa index -a is <ref.fasta>
 → 8種類のファイルが作られる
   (.amb, .ann, .bwt, .pac, .rbwt, .rpac, .rsa, .sa)

bwa aln
 bwa aln <ref.fasta> <fastq1.txt> > <aln.result1.sai> | 
 bwa aln <ref.fasta> <fastq2.txt> > <aln.result2.sai>
 → single-endの場合は上の1行のみ
   .saiファイルが作られる

bwa sampe(paired-endの場合)
 bwa sampe <ref.fasta> <aln.result1.sai> <aln.result2.sai> <fastq1.txt> <fastq2.txt> > <sampe.result.sam>
 → .samファイルが作られる

bwa samse(single-endの場合)
 bwa samse <ref.fasta> <aln.result1.sai> <fastq1.txt> > <samse.result.sam>
 → .samファイルが作られる

0 件のコメント:

コメントを投稿