发表在Nature Methods上的在线分析工具,是一个怎样的操作?
作者:互联网
https://cibersort.stanford.edu/
聊一个发表在26分杂志上的在线分析神器,此前白介素同学写过一期关于免疫浸润分析,数据挖掘新高度的推文。 这里是续集,数据挖掘新高度(二)
Step1准备数据
在数据分析之前首先需要准备好自己的数据格式,要求不能有缺失值,txt文档不能有双引号,建议数据不要经过log转换。
mixture文档,实际上就是要自己准备好一个表达矩阵,举个栗子如下:
第一个文件
特别注意一点是,数据格式对ID类型不作要求,唯一的要求是必须跟其它提供的文件ID是匹配的,这个还是比较容易做到的嘛。
第二个文件
可以自己输入Signature文件作为参考signature,如果自己准备就准备成下面框框的格式。 也可以选择它本身提供的 LM22 这个signature文件,但要强调的是 LM22仅仅在两个芯片平台上验证过,RNA-seq平台未验证,并且,如果用这个,必须保证你的Mixture文件的ID也用的HUGO。
________________________________________
如果行自己上传 gene signature也是可行的,准备好 signature文件即可。 除此以外如果自己没有 gene signature的话,又不用它自带的 gene signature的话,也可以用,这时就要提供下面两个文件,利用这个数据库来产生 gene signature:
还需要一个 phenotype的文件,格式如下:
Step2-上传文件 and Run
下面我们来上传一个数据分析下试试看,上传一个mixture文件,格式如下:
需要几分钟的时间处理,然后就可以在结果部分看到,行为sample名,列为免疫浸润分数。
还有另外一个图:
除此之外呢,提供所有,分析结果的 CSV, pdf等格式的数据下载,这样就方便大家自己去下载,然后按照自己的要求绘制其它图形,得到的重要结果就是免疫浸润分数。
聊一聊这个免疫浸润分析工具的来头,该数据库由斯坦福大学医学院的研究团队开发的,相关论文2015年发表在 Nature Methods杂志上,截止目前的引用量为645次。
这个工具其实在此前白介素同学撰写的[肿瘤免疫浸润分析工具汇总]一文中有提到过,上次还做了标注。跟此前介绍的 TIMER 数据库(https://cistrome.shinyapps.io/timer/)相比呢,在使用的友好程度上没有那么高,但是引用次数更高。
需要注册,比较麻烦。而且教程不够完善,个人认为教程讲的不是很清楚,对新手而言要使用需要一定的学习成本。另外就是可视化程度不够高,而TIMER的美图,确实是超酷啊。不过既然发表的论文在高级的杂志,可能在算法层面有自己的优越性吧,这个就超出白介素同学能力范围了,这里不作评价了。至于究竟使用哪个,还是需要看大家自己的需求哈,反正都是可靠的!
好了,这是白介素同学自己探索这个分析工具的所得基本就是这些啦,探索的过程比较曲折,还是分享给大家。
标签:文件,在线,Nature,白介素,浸润,自己,signature,gene,Methods 来源: https://blog.51cto.com/u_15127646/2778603