《2021政府工作报告》词云图一览
作者:互联网
1.前言
随着两会的召开,一系列政策方针成为新闻焦点,其中最引人注目之一的还属国务院《政府工作报告》。今年的政府工作报告有哪些值得关注的地方,快随小编…(成营销号了)
2.解读
本文将对比《2020年政府工作报告》对刚出炉的《2021年政府工作报告》来做解读,通过词云图的形式进行展现。
3.制图
3.1 分词
目前分词已经是非常常见的自然语言处理任务。尽管分词本身并不好做,其实还挺难的,但并不妨碍市面上有非常多的分词工具可供选择,如结巴分词等。我们这里选用百度的LAC2.0分词,是基于飞桨框架(PaddlePaddle)实现的词法分析工具,可以通过pip 安装
pip install lac
其分词效果挺不错的,参考之前解读《2020政府工作报告》的推文基于百度LAC2.0的词云图生成——各大分词工具实战比较。直观来看,几个分词工具似乎性能相当
但如果考虑更细粒度的词性,在地名和机构方面,LAC优势非常明显(百度打钱!)
(机构↑)
(地名↑)
3.2 制图
wordcloud是一个强大的词云图生成工具,同样可以pip下载。
from wordcloud import WordCloud
wc = WordCloud(
background_color="white",#背景色
max_words=500,
min_font_size=20,
max_font_size=100,
width=500,
height=384,
font_path="Alibaba-PuHuiTi-Light.ttf"#中文字体
)
我本人强烈推荐在WordCloud的初始化时设定好这些参数。由于我们是中文词云图,因此务必提供中文字体。这里我们使用阿里巴巴的普惠体,因为阿里曾说永久免费。运营公众号或者写博客什么的,还是谨慎一些好,避免侵权之类的。尽管说实话,阿里普惠体 挺丑的。
4. 2021与2020年政府工作报告词云图对比一览
4.1 总览
(2021总览↑)
(2020总览↑)
不难看出,发展才是硬道理。
4.2 名词情况
(2021名词↑)
(2020名词↑)
从名词统计来看,得益于我国政府的科学严谨的疫情防控政策,在过去一年内我国迅速果断控制了疫情,经济建设与发展也取得了出色成绩,使得疫情在2021年的词云图中小了很多。此外我比较关心的科技话题在2021年的报告中也更多被提及。
4.3 动词情况
图片上传失败,这块不写了
4.4 地名情况
(2021地名↑)
(2020地名↑)
这一年,湖北及武汉仍然是关注焦点。此外近两年来都有提到成渝地区,这不能不让人联想到振奋人心的最新的中国经济发展空间格局规划。(图自新华网·思客,侵删)
5.总结
今年的政府工作报告非常振奋人心,我们对2021年中国的发展充满自信。本来打算让一个考研的朋友写一篇解读放在这里,但他比较羞涩。我本人不擅长分析政策,但从词云图来看2021对我们国家和每一个人来说,也注定是非凡的一年。
标签:报告,一览,云图,2020,2021,分词,地名 来源: https://blog.csdn.net/RadiumTang/article/details/114443782