首页 > TAG信息列表 > seqkit

seqkit | 序列处理利器 | fastq | fasta

有时候需要个性化处理原始序列,自己写python脚本太慢,且速度太慢,可以用seqkit这个工具,开发得不错。   比如提取10x genomics的barcode,fastq里的前16个碱基。 seqkit subseq Vcl-YFP-CNCC_3_S35_L004_R2_001.fastq.gz -r 1:16 > tmp.fastq      参考: fasta/fq文件处理万能工具

fasta序列操作神器——seqkit

一、序列操作: 1.取反向序列 seqkit seq test.fa -r > test_re.fa 2.取互补序列 seq test.fa -p > test_com.fa 3.取反向互补序列 seqkit seq test.fa -r -p > test_re_com.fa 4.DNA序列转换为RNA序列 seqkit seq test.fa --nda2rna > test_rna.fa 5.RNA序列转换为DNA序列 seqkit se

统计fasta序列条数

1.统计大于号开始的行数或seqkit 工具 # 通过搜索>的数量 grep -c '^>' myFasta.fasta 1397492 #seqkit统计提取,速度也是很快的 seqkit stats t.fa -T | grep -v file | cut -f 4 1397492 # 统计 1-100bp 范围长的序列数 cat t.fa | seqkit seq -m 1 -M 100 | seqkit stat -T | gre