机器学习基本问答。
作者:互联网
机器学习基本问答。
- 您如何定义机器学习?
答。 ML 是关于构建可以从数据中学习的系统。学习意味着在某些任务上做得更好,给定一些绩效衡量标准。
- ** 什么是有标签的训练集?**
答。带标签的训练集是一个训练集,其中包含每个实例所需的解决方案(也称为标签)。
- ** 两种最常见的监督任务是什么?**
答。两个最常见的监督任务是回归和分类。
- ** 你能说出四个常见的无监督任务吗?**
答。常见的无监督任务,包括聚类、可视化、降维和关联学习。
- ** 你会使用什么类型的机器学习算法来让机器人在各种未知地形中行走?**
答。如果我们希望机器人学习在各种未知地形中行走,强化学习可能表现最好,因为这通常是监督或半监督学习问题的类型,但它会不太自然。
6 ** .您会将垃圾邮件检测问题定义为监督学习问题还是无监督学习问题?**
答。垃圾邮件检测是一个典型的监督学习问题:该算法被提供了许多电子邮件及其标签(垃圾邮件或非垃圾邮件)。
- ** 什么是在线学习系统?**
答。与批量学习系统相反,在线学习系统可以增量学习。这使得它能够快速适应不断变化的数据和自治系统,并能够对大量数据进行训练。
- ** 什么是核心学习?**
答。核外算法可以处理大量无法放入计算机主存储器的数据。核外学习将数据分成小批量,并使用学习技术从这些小批量中学习。
- ** 哪种类型的学习算法依赖于相似性度量来进行预测?**
答。一个基于实例的学习系统通过心脏学习训练数据;然后,当给定一个新实例时,它使用相似性度量来找到最相似的学习实例并使用它们进行预测。
- ** 模型参数和学习算法的超参数有什么区别?**
答。模型参数是所选模型的变量,可以通过将给定数据拟合到模型来估计。
例子:
在上图中,x 是自变量,y 是因变量。目标是为数据拟合回归线。然后使用这条线(模型)来预测未见过的 x 值的 y 值。这里,m 是斜率,c 是直线的截距。这两个参数(m 和 c)是通过最小化 RMSE(均方根误差)将一条直线拟合到数据来估计的。因此,这些参数称为模型参数。
不同模型中的模型参数:
- 线性回归中的 m(斜率)和 c(截距)
- 神经网络中的权重和偏差
模型超参数是在模型开始训练之前设置其值的参数。它们不能通过将模型拟合到数据来学习。
例子:
在上图中,x 轴代表 epoch 的数量,y 轴代表 epoch 的数量。我们可以看到在某个时间点之后,虽然训练准确度增加了,但验证和测试准确度开始下降。这是一个过拟合的例子。这里的时期数是一个超参数,是手动设置的。将此数字设置为较小的值可能会导致欠拟合,而较高的值可能会导致过拟合。
不同模型中的模型超参数:
- 梯度下降中的学习率
- 梯度下降中的迭代次数
- 神经网络中的层数
- 神经网络中每层的神经元数量
- k中的簇数(k)表示聚类
- ** 什么是测试集,为什么要使用它?**
答。测试集是 测试集合 并且您的测试可以在多个测试集中引用,但它始终是相同的测试。当您创建一个测试执行时,它将与同一个测试相关联。
为什么我们使用测试数据集?
训练数据是您用来教机器学习应用程序识别模式或执行您的标准的初始数据集,同时使用测试或验证数据 评估模型的准确性 .您将需要一个新数据集来验证模型,因为它已经“知道”训练数据。
测试集是什么意思?
测试集是数据挖掘中使用的数据集的一部分,用于根据验证集的性能评估从竞争模型中选择的单个预测或分类模型的可能未来性能。
- ** 验证集的目的是什么?**
答。必须定期评估模型以进行训练,这正是验证集的用途。我们可以确定 模型的准确度 通过计算它在每个给定点的验证集上产生的损失。这就是培训的全部内容。
什么是验证数据集?简单来说:
- 验证数据集是用于微调分类器超参数的实例集合。
- 验证数据集是混合的:它是用于测试的训练数据,但不包含在低级训练或最终测试中。
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明
本文链接:https://www.qanswer.top/11890/02080401
标签:机器,训练,数据,模型,学习,参数,测试,问答 来源: https://www.cnblogs.com/amboke/p/16654119.html