其他分享
首页 > 其他分享> > 《2021政府工作报告》词云图一览

《2021政府工作报告》词云图一览

作者:互联网

1.前言

随着两会的召开,一系列政策方针成为新闻焦点,其中最引人注目之一的还属国务院《政府工作报告》。今年的政府工作报告有哪些值得关注的地方,快随小编…(成营销号了)

2.解读

本文将对比《2020年政府工作报告》对刚出炉的《2021年政府工作报告》来做解读,通过词云图的形式进行展现。

3.制图

3.1 分词

目前分词已经是非常常见的自然语言处理任务。尽管分词本身并不好做,其实还挺难的,但并不妨碍市面上有非常多的分词工具可供选择,如结巴分词等。我们这里选用百度的LAC2.0分词,是基于飞桨框架(PaddlePaddle)实现的词法分析工具,可以通过pip 安装

pip install lac

其分词效果挺不错的,参考之前解读《2020政府工作报告》的推文基于百度LAC2.0的词云图生成——各大分词工具实战比较。直观来看,几个分词工具似乎性能相当

图片

但如果考虑更细粒度的词性,在地名和机构方面,LAC优势非常明显(百度打钱!)

图片

(机构↑)

图片

(地名↑)

3.2 制图

wordcloud是一个强大的词云图生成工具,同样可以pip下载。

from wordcloud import WordCloud
wc = WordCloud(
    background_color="white",#背景色
    max_words=500,
    min_font_size=20,
    max_font_size=100,
    width=500,
    height=384,
    font_path="Alibaba-PuHuiTi-Light.ttf"#中文字体
)

我本人强烈推荐在WordCloud的初始化时设定好这些参数。由于我们是中文词云图,因此务必提供中文字体。这里我们使用阿里巴巴的普惠体,因为阿里曾说永久免费。运营公众号或者写博客什么的,还是谨慎一些好,避免侵权之类的。尽管说实话,阿里普惠体 挺丑的。

4. 2021与2020年政府工作报告词云图对比一览

4.1 总览

图片

(2021总览↑)

图片

(2020总览↑)

不难看出,发展才是硬道理。

4.2 名词情况

图片

(2021名词↑)

图片

(2020名词↑)

从名词统计来看,得益于我国政府的科学严谨的疫情防控政策,在过去一年内我国迅速果断控制了疫情,经济建设与发展也取得了出色成绩,使得疫情在2021年的词云图中小了很多。此外我比较关心的科技话题在2021年的报告中也更多被提及。

4.3 动词情况

图片上传失败,这块不写了

4.4 地名情况

图片

(2021地名↑)

图片

(2020地名↑)

这一年,湖北及武汉仍然是关注焦点。此外近两年来都有提到成渝地区,这不能不让人联想到振奋人心的最新的中国经济发展空间格局规划。(图自新华网·思客,侵删)

图片

 

5.总结

今年的政府工作报告非常振奋人心,我们对2021年中国的发展充满自信。本来打算让一个考研的朋友写一篇解读放在这里,但他比较羞涩。我本人不擅长分析政策,但从词云图来看2021对我们国家和每一个人来说,也注定是非凡的一年。

标签:报告,一览,云图,2020,2021,分词,地名
来源: https://blog.csdn.net/RadiumTang/article/details/114443782