其他分享
首页 > 其他分享> > 第三篇:文本分类

第三篇:文本分类

作者:互联网

目录

 

分类基础

文本分类任务

分类算法

评估


分类基础

输入:

输出:

文本分类任务

一些常见的例子:

构建一个文本分类器流程:

1. 确定感兴趣的任务
2. 收集合适的语料库
3.进行标注
4. 特征选择
5. 选择机器学习算法
6. 使用保留的数据集训练模型和调整超参数
7. 根据需要重复前面的步骤
8. 训练最终模型
9. 在测试数据集上评估模型

分类算法

挑选算法:

接下来,简单介绍几种常见的算法:

评估

 预测标签
真实标签AB
A7913
B810

Accuracy = 正确的分类/总分类= (79+10)/(79+13+8+10)

B 假定为 positive 类

Precision = 正确分类的B(True Positive)/分类为B的所有(TP+False Positive) = 10/(10+13)

Recall = 正确分类的B(True Positive)/真实为B的所有(TP+False Negative) = 10/(10+8)

F1-SCORE = 2*Precision*Recall/(Precision+Recall)

在用于多类时,指标会有以下两种:

今天就到这里,感谢大家观看,辛苦,有问题,欢迎随时评论探讨。

 

 

标签:10,第三篇,特征,语料库,分类,分类器,类别,文本
来源: https://blog.csdn.net/flying_1314/article/details/117422741