首页 > 其他分享> > 机器学习基本问答。

机器学习基本问答。

2022-09-04 01:33:57 作者：互联网

答。 ML 是关于构建可以从数据中学习的系统。学习意味着在某些任务上做得更好，给定一些绩效衡量标准。

答。带标签的训练集是一个训练集，其中包含每个实例所需的解决方案（也称为标签）。

答。两个最常见的监督任务是回归和分类。

答。常见的无监督任务，包括聚类、可视化、降维和关联学习。

答。如果我们希望机器人学习在各种未知地形中行走，强化学习可能表现最好，因为这通常是监督或半监督学习问题的类型，但它会不太自然。

6 ** .您会将垃圾邮件检测问题定义为监督学习问题还是无监督学习问题？**

答。垃圾邮件检测是一个典型的监督学习问题：该算法被提供了许多电子邮件及其标签（垃圾邮件或非垃圾邮件）。

答。与批量学习系统相反，在线学习系统可以增量学习。这使得它能够快速适应不断变化的数据和自治系统，并能够对大量数据进行训练。

答。核外算法可以处理大量无法放入计算机主存储器的数据。核外学习将数据分成小批量，并使用学习技术从这些小批量中学习。

答。一个基于实例的学习系统通过心脏学习训练数据；然后，当给定一个新实例时，它使用相似性度量来找到最相似的学习实例并使用它们进行预测。

答。模型参数是所选模型的变量，可以通过将给定数据拟合到模型来估计。

例子：

在上图中，x 是自变量，y 是因变量。目标是为数据拟合回归线。然后使用这条线（模型）来预测未见过的 x 值的 y 值。这里，m 是斜率，c 是直线的截距。这两个参数（m 和 c）是通过最小化 RMSE（均方根误差）将一条直线拟合到数据来估计的。因此，这些参数称为模型参数。

不同模型中的模型参数：

模型超参数是在模型开始训练之前设置其值的参数。它们不能通过将模型拟合到数据来学习。

例子：

在上图中，x 轴代表 epoch 的数量，y 轴代表 epoch 的数量。我们可以看到在某个时间点之后，虽然训练准确度增加了，但验证和测试准确度开始下降。这是一个过拟合的例子。这里的时期数是一个超参数，是手动设置的。将此数字设置为较小的值可能会导致欠拟合，而较高的值可能会导致过拟合。

不同模型中的模型超参数：

答。测试集是 测试集合 并且您的测试可以在多个测试集中引用，但它始终是相同的测试。当您创建一个测试执行时，它将与同一个测试相关联。

为什么我们使用测试数据集？

训练数据是您用来教机器学习应用程序识别模式或执行您的标准的初始数据集，同时使用测试或验证数据 评估模型的准确性 .您将需要一个新数据集来验证模型，因为它已经“知道”训练数据。

测试集是什么意思？

测试集是数据挖掘中使用的数据集的一部分，用于根据验证集的性能评估从竞争模型中选择的单个预测或分类模型的可能未来性能。

答。必须定期评估模型以进行训练，这正是验证集的用途。我们可以确定模型的准确度通过计算它在每个给定点的验证集上产生的损失。这就是培训的全部内容。

什么是验证数据集？简单来说：

标签：机器,训练,数据,模型,学习,参数,测试,问答
来源： https://www.cnblogs.com/amboke/p/16654119.html