其他分享
首页 > 其他分享> > 机器学习---吴恩达---Week6_2(机器学习系统设计)

机器学习---吴恩达---Week6_2(机器学习系统设计)

作者:互联网

Machine Learing System Design(机器学习系统设计)

Ways to improve the accuracy of a classifier(提高分类器准确性的几个方法)

It is difficult to tell which of the options will be most helpful.(很难说哪种最有用,不过理性思考比靠直觉尝试更可行)

Error Analysis(误差分析)

Manually examine the errors on examples in the cross validation set and try to spot a trend where most of the errors were made.(人工检查验证集的结果,寻找系统性偏差)

Recommended approach to solving machine learning problems(算法实施推荐方法)

 

numerical value(结果的数值评估)

Error Metrics for Skewed Classes(偏斜类的误差度量)

偏斜类指一些分布概率差距较大的分类,例如某件事的发生概率为0.5%,该类别为一个偏斜类,这种情况下,即使不对分类做出任何算法处理,也会得到较高的准确定,即不知道提高准确性是否表明算法的分类效果有所提升,需要新的概念进行进行误差度量。

Precision and Recall(查准率和召回率)

Trading Off Precision and Recall(平衡选择查准率与召回率)

根据不同情况确定合适阈值,选择高查准率,低召回率与高召回率,低查准率的情况。

 F1 score(F score)

Data For Machine Learning(ML数据选择)

有较多参数的低偏差算法,训练误差较小,为了提高算法准确性,降低方差,需要增加更多训练实例,使得验证误差降低到和训练误差同一水平,得到低方差的正常算法。

标签:误差,吴恩达,errors,机器,cross,算法,Week6,data,查准率
来源: https://www.cnblogs.com/zouhq/p/10682427.html