首页 > TAG信息列表 > vdic

python 对文本进行分词

# 导入正则表达式相关模块 import re # 定义一个函数,通过该函数查找文本字符串中的每一个单词 # 然后计算每个单词出现的次数,最后按照出现次数从多到少放到变量中 def get_char(txt): # 通过re.split()函数将英文单词分别取出来,函数的第一个参数是分隔符 # 第一个参数