首页 > 编程语言> > Python学习笔记——jieba库

Python学习笔记——jieba库

2020-02-02 23:04:32 作者：互联网

lcut（）函数：分割字符串，返回一个列表。

lcut_for_search（）函数：比lcut( )更加精准，但是会产生重复。

add_word( ) 函数：往分词词库里添加词语。

del_word( ) 函数：往分词词库里删除词语。

import jieba
s = "思考快与慢的作者是丹尼尔卡尼曼"

ls1 = jieba.lcut(s)
print(ls1)
jieba.add_word("思考快与慢")
ls1 = jieba.lcut(s)
print(ls1)
jieba.del_word("思考快与慢")

ls2 = jieba.lcut(s,cut_all = True)
print(ls2)
jieba.add_word("思考快与慢")
ls2 = jieba.lcut(s,cut_all = True)
print(ls2)
jieba.del_word("思考快与慢")

ls3 = jieba.lcut_for_search(s)
print(ls3)
jieba.add_word("思考快与慢")
ls3 = jieba.lcut_for_search(s)
print(ls3)

输出：
['思考', '快', '与', '慢', '的', '作者', '是', '丹尼尔', '卡尼曼']
['思考', '快', '与', '慢', '的', '作者', '是', '丹尼', '丹尼尔', '尼尔', '卡', '尼', '曼']
['思考', '快', '与', '慢', '的', '作者', '是', '丹尼', '尼尔', '丹尼尔', '卡尼曼']


['思考快与慢', '的', '作者', '是', '丹尼尔', '卡尼曼']
['思考', '思考快与慢', '的', '作者', '是', '丹尼', '丹尼尔', '尼尔', '卡', '尼', '曼']
['思考', '思考快与慢', '的', '作者', '是', '丹尼', '尼尔', '丹尼尔', '卡尼曼']

标签：jieba,word,Python,笔记,lcut,丹尼尔,思考,print
来源： https://www.cnblogs.com/zhengmq2010/p/12254169.html