编程语言
首页 > 编程语言> > Python学习笔记——jieba库

Python学习笔记——jieba库

作者:互联网

lcut()函数:分割字符串,返回一个列表。

lcut_for_search()函数:比lcut( )更加精准,但是会产生重复。

add_word( ) 函数:往分词词库里添加词语。

del_word( ) 函数:往分词词库里删除词语。

import jieba
s = "思考快与慢的作者是丹尼尔卡尼曼"

ls1 = jieba.lcut(s)
print(ls1)
jieba.add_word("思考快与慢")
ls1 = jieba.lcut(s)
print(ls1)
jieba.del_word("思考快与慢")

ls2 = jieba.lcut(s,cut_all = True)
print(ls2)
jieba.add_word("思考快与慢")
ls2 = jieba.lcut(s,cut_all = True)
print(ls2)
jieba.del_word("思考快与慢")

ls3 = jieba.lcut_for_search(s)
print(ls3)
jieba.add_word("思考快与慢")
ls3 = jieba.lcut_for_search(s)
print(ls3)

输出:
['思考', '快', '与', '慢', '的', '作者', '是', '丹尼尔', '卡尼曼']
['思考', '快', '与', '慢', '的', '作者', '是', '丹尼', '丹尼尔', '尼尔', '卡', '尼', '曼']
['思考', '快', '与', '慢', '的', '作者', '是', '丹尼', '尼尔', '丹尼尔', '卡尼曼']


['思考快与慢', '的', '作者', '是', '丹尼尔', '卡尼曼']
['思考', '思考快与慢', '的', '作者', '是', '丹尼', '丹尼尔', '尼尔', '卡', '尼', '曼']
['思考', '思考快与慢', '的', '作者', '是', '丹尼', '尼尔', '丹尼尔', '卡尼曼']

 

标签:jieba,word,Python,笔记,lcut,丹尼尔,思考,print
来源: https://www.cnblogs.com/zhengmq2010/p/12254169.html