数据库
首页 > 数据库> > 大型数据库的应用项目之基于中文新闻分词绘制词云图

大型数据库的应用项目之基于中文新闻分词绘制词云图

作者:互联网

项目:基于中文新闻分词绘制词云图

一、项目关键实现:jieba中文分词、分词结果统计、词云图展示、前端树形结构展示

二、项目关键技术:jsp,servlet,mvc模式,ajax,echarts,mysql数据库,jieba分词,python。

三、项目关键步骤:前后端词云数据交互,前后端折线图数据交互,前端页面展示。

四、项目展示:

      文末有源码地址,希望多多支持!!

1、数据导入展示:

将所有类别的新闻导入数据库中。以树形目录形式展示新闻类别,每个树形节点代表新闻分类,括号中代表该类新闻的数量,选择每个新闻,以列表形式显示新闻标题,点击新闻标题,可以查看详细信息。

1.1将excel里的新闻数据导入mysql

首先分别建立八个类别的新闻数据表与总新闻数据表:

1.2在前端页面建立新闻类别的树形目录

index.jsp:

 

finance.jsp:

其他类型新闻展示界面类似

1.3 新闻详细内容查看界面

    点击标题后的查看即可显示对应内容

1.4 前端目录结构

 

2、文章统计:

2.1 建立新闻数据统计表

 

2.2 将数据库的数据从后端导出

建立Bean层:

 

建立Dao层

 

建立DB层:

 

建立servlet层

2.3 将后端的数据通过ajax传到前端页面

2.4 效果展示:

 

3、文章分词:

 使用中文分词算法解析所有新闻正文,并统计每个词语出现的数量,并以词云图的方式展示,点击词云图中该词语,显示其数量。

   3.1建立python项目,将各类型新闻内容分别放在txt文件中(以教育新闻为例)

    3.2 用python连接mysql数据库,然后将jieba分词的结果导入mysql

建立分词统计表后,导入jieba依赖:

import jieba

import jieba.analyse

import pymysql

运行项目,得到分词统计结果:

3.3 将分词结果表中的数据用ajax技术导入到前端词云界面    

3.4 效果展示:

总词云:

分类词云:

以上即为项目的所有内容。

项目源码地址:https://pan.baidu.com/s/1HJ9hBG0CSPDWJYkDz1QdDg

提取码9999,希望多多点赞,评论支持

标签:jieba,展示,新闻,数据库,项目,云图,分词
来源: https://www.cnblogs.com/nzpdbk/p/15656982.html