首页 > TAG信息列表 > 词元

NLP学习

文本是序列数据的一种最常见的形式之一 为了对文本进行预处理,通常将文本拆分成词元,构建词表将词元字符串映射为数字索引,并将文本数据转换为词元索引以供模型操作。