编程语言
首页 > 编程语言> > [Python]利用jieba.analyse进行 关键词 提取

[Python]利用jieba.analyse进行 关键词 提取

作者:互联网

1、简单应用

代码如下:

 1 #!/usr/bin/env python
 2 # -*- coding: utf-8 -*-
 3 # @File  : jieba.analyse.py
 4 # @Author: 赵路仓
 5 # @Date  : 2020/3/14
 6 # @Desc  : 提取关键字
 7 # @Contact : 398333404@qq.com 
 8 
 9 import jieba.analyse
10 
11 
12 text='安全、防止水合物和段塞生成的重要措施之一。因此,针对未来还上油田开发技术,我们预先开展了水深1500米管道式油气水分离器的概念设计。通过该研究,提出适合海洋环境的体积小、重量轻、分离效率高、便于操作和维护的新型油气水三相分离器,使其成为海洋深水油气田开'
13 Key=jieba.analyse.extract_tags(text,topK=3)
14 print(Key)

 

 2、含参使用

 keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=()) 

代码如下:

 1 #!/usr/bin/env python
 2 # -*- coding: utf-8 -*-
 3 # @File  : jieba.analyse.py
 4 # @Author: 赵路仓
 5 # @Date  : 2020/3/14
 6 # @Desc  : 提取关键字
 7 # @Contact : 398333404@qq.com 
 8 
 9 import jieba.analyse
10 
11 
12 # 字符串前面加u表示使用unicode编码
13 content = u'安全、防止水合物和段塞生成的重要措施之一。因此,针对未来还上油田开发技术,我们预先开展了水深1500米管道式油气水分离器的概念设计。通过该研究,提出适合海洋环境的体积小、重量轻、分离效率高、便于操作和维护的新型油气水三相分离器,使其成为海洋深水油气田开'
14 
15 keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=())
16 # 访问提取结果
17 for item in keywords:
18     # 分别为关键词和相应的权重
19     print(item[0], item[1])

 

标签:jieba,提取,14,Python,关键词,analyse,分离器
来源: https://www.cnblogs.com/zlc364624/p/12494125.html