其他分享
首页 > 其他分享> > 生物信息之独孤九剑——sort

生物信息之独孤九剑——sort

作者:互联网

编者按:

在金庸武学体系的众多武功之中,独孤九剑并不是最强劲的武功,它与其他武林绝学有很大的不同,可以说是鹤立鸡群。比如乔峰的降龙十八掌,段誉的六脉神剑,张无忌的九阳神功,石破天的罗汉伏魔神功,这些神功都需要强大的内力支撑,而独孤九剑则不同,不需要内力,这点其实可以从华山派气宗与剑宗的分歧就可以看出来。独孤九剑传人风清扬属于剑宗,更注重招式,而不是像剑宗注重练气。独孤九剑分为总诀式,破剑式,破刀式,破枪式,破鞭式,破索式,破箭式,破掌式,破气式,遇到不同的场景使用关不同的招式,因此,独孤九剑更加注重问题的解决,本质上就是就是通过工具来解决问题。只要学会这九剑,就可以处理很多的问题。学习生物信息也是同样的道理,当然练好内功,掌握很好的基础是非常必要的,但是也可以学习一些小工具,解决一些实际问题。那么从这次内容开始,我们就来给大家介绍生物信息之独孤九剑。

文本排序是计算机编程中非常重要的一项工作,排序之后的数据更加具有规律,并且更方便处理。在生物信息分析中排序也是非常重要的工作,我们常常需要根据基因组的坐标位置进行排序,例如在利用短序列比对进行变异检测的过程中, 首先就需要进行排序,例如bwa比对之后,利用samtools对bam结果进行排序,然后才能进行后续的分析。在Linux系统中,可以使用sort工具对文本文件内的内容进行排序

排序主要可以分为三种情况:

第一种:根据数字大小进行排序,例如根据坐标位置大小进行排序,根据比对的分值大小排序结果;

第二种:根据根据字符大小进行排序,比如abcdef这种顺序;

第三种:给定一个文件,里面包含了指定的顺序。

案例一:直接排序;

sort

案例二:按相反顺序进行排序;

sort -r

案例三:根据数字大小进行排序;

sort -n

案例四:排序去除重复;

sort -u

案例五:多条件排序;

sort -nrk3 -k2 #首先按照第三列进行排序,然后按照第2列进行排序;

案例六:统计blast比对上的序列数目;

awk '{print $1} ’ blast.out | sort -n | uniq | wc

更多内容,欢迎订阅微信公众号:基因学苑

标签:sort,独孤九剑,剑宗,案例,生物,排序,进行
来源: https://blog.csdn.net/xxxie_/article/details/97005266