其他分享
首页 > 其他分享> > LOTClass中文使用

LOTClass中文使用

作者:互联网

LOTClass 的中文实验、学习、应用。提供中文新闻多分类案例和数据

 

  1. 原始论文完全不适合于中文,因为中文BERT目前大都是基于字的,因此不能直接换BERT来拿来主义的套用到中文BERT。
  2. 好在有追一科技提出了词汇级BERT,WoBERT,不过是keras的,不适合Pytorch,于是自己训练了一个:WoBERT
  3. 最后稍微自定义了BERT中的分词器,实现了中文版的LOTClass:https://github.com/425776024/LOTClass

 

标签:BERT,中文,LOTClass,适合,WoBERT,拿来主义,使用
来源: https://blog.csdn.net/jiang425776024/article/details/113818912