Python学习笔记——jieba库
作者:互联网
lcut()函数:分割字符串,返回一个列表。
lcut_for_search()函数:比lcut( )更加精准,但是会产生重复。
add_word( ) 函数:往分词词库里添加词语。
del_word( ) 函数:往分词词库里删除词语。
import jieba s = "思考快与慢的作者是丹尼尔卡尼曼" ls1 = jieba.lcut(s) print(ls1) jieba.add_word("思考快与慢") ls1 = jieba.lcut(s) print(ls1) jieba.del_word("思考快与慢") ls2 = jieba.lcut(s,cut_all = True) print(ls2) jieba.add_word("思考快与慢") ls2 = jieba.lcut(s,cut_all = True) print(ls2) jieba.del_word("思考快与慢") ls3 = jieba.lcut_for_search(s) print(ls3) jieba.add_word("思考快与慢") ls3 = jieba.lcut_for_search(s) print(ls3) 输出: ['思考', '快', '与', '慢', '的', '作者', '是', '丹尼尔', '卡尼曼'] ['思考', '快', '与', '慢', '的', '作者', '是', '丹尼', '丹尼尔', '尼尔', '卡', '尼', '曼'] ['思考', '快', '与', '慢', '的', '作者', '是', '丹尼', '尼尔', '丹尼尔', '卡尼曼'] ['思考快与慢', '的', '作者', '是', '丹尼尔', '卡尼曼'] ['思考', '思考快与慢', '的', '作者', '是', '丹尼', '丹尼尔', '尼尔', '卡', '尼', '曼'] ['思考', '思考快与慢', '的', '作者', '是', '丹尼', '尼尔', '丹尼尔', '卡尼曼']
标签:jieba,word,Python,笔记,lcut,丹尼尔,思考,print 来源: https://www.cnblogs.com/zhengmq2010/p/12254169.html