编程语言
首页 > 编程语言> > TextRank算法

TextRank算法

作者:互联网

#-*- coding=utf8 -*-
from jieba import analyse 
# 引入TextRank关键词抽取接口 
textrank = analyse.textrank # 原始文本 
text = "非常线程是程序执行时的最小单位,它是进程的一个执行流,\ 是CPU调度和分派的基本单位,一个进程可以由很多个线程组成,\ 线程间共享进程的所有资源,每个线程有自己的堆栈和局部变量。\ 线程由CPU独立调度执行,在多CPU环境下就允许多个线程同时运行。\ 同样多线程也可以实现并发操作,每个请求分配一个线程来处理。"
print ("\nkeywords by textrank:") # 基于TextRank算法进行关键词抽取 
keywords = textrank(text,topK=10,withWeight=True,allowPOS=('ns', 'n'))

# 输出抽取出的关键词 f
words=[keyword for keyword,w in keywords if w>0.2]
print (' '.join(words) + "\n")

 

标签:抽取,关键词,算法,线程,TextRank,CPU,textrank
来源: https://blog.csdn.net/weixin_38241876/article/details/89847149