对采集的游记进行数据分析
作者:互联网
使用jieba模块对内容进行处理,在tfidf.py源码中加入一些自定义的停用词,然后将生成的列表词组使用WordCloud展示出来
from jieba import analyse
# 引入TF-IDF关键词抽取接口
tfidf = analyse.extract_tags
import matplotlib.pyplot as plt
from wordcloud import WordCloud,STOPWORDS,ImageColorGenerator
import jieba
from scipy.misc import imread
d = os.path.dirname(__file__)
font = r'C:\Windows\Fonts\00CAB71B.007.ttf'
对游记中出现的地名统计发现:
在地图中的位置如下:
标签:数据分析,__,jieba,analyse,tfidf,采集,WordCloud,import,游记 来源: https://www.cnblogs.com/qqzj/p/7726711.html