其他分享
首页 > 其他分享> > PubMed文献数据挖掘

PubMed文献数据挖掘

作者:互联网

 

这里集合了人类目前几乎所有的生物医学的智慧,可以做的东西太多了,就怕你没想象力。

 

第一步:下载数据

# go to pubmed ftp and get files
cat file.list.raw | grep pubmed22 | grep -v md5 | cut -f1 -d' ' > file.names
cat file.names | wc -l
# https://ftp.ncbi.nlm.nih.gov/pubmed/baseline/
cat file.names | awk '{print "https://ftp.ncbi.nlm.nih.gov/pubmed/baseline/"$0}' > file.list
wget -bi file.list

  

 

第二步:提取数据

靠NPL提取文献摘要的信息。

 

 

第三步:分析数据

 

 

待续~

 

标签:ftp,list,cat,PubMed,names,file,数据挖掘,文献,pubmed
来源: https://www.cnblogs.com/leezx/p/15744456.html