100+数据科学面试问题和答案总结 - 机器学习和深度学习
作者:互联网
来自Amazon,谷歌,Meta, Microsoft等的面试问题,本文接着昨天的文章整理了机器学习和深度学习的问题
机器学习
54、什么是机器学习?
机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式,并将现有内容进行知识结构划分来有效提高学习效率。
机器学习有下面几种定义:
(1)机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。
(2)机器学习是对能通过经验自动改进的计算机算法的研究。
(3)机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。
55、什么是无监督学习?
无监督学习是一种机器学习算法,用于从由输入数据组成的数据集中推断,并且学习时不需要对数据进行标记。
主要包括:聚类,降维,异常检测等
56、有哪些不同的分类算法?
下图列出了最重要的分类算法。
57、朴素贝叶斯中的“朴素”是什么?
朴素贝叶斯算法是基于贝叶斯定理的。贝叶斯定理描述了一个事件发生的概率,基于可能与该事件相关的条件的先验知识。
这个算法很“幼稚”,因为它所做的假设可能是正确的,也可能不是。
58、如何建立随机森林模型?
随机森林模型结合了许多决策树模型。所选择的决策树具有高偏差和低方差。每个决策树都取样本的子集,并进行预测。每棵决策树的结果都被记录下来,并以大多数作为答案,在分类问题中是众数,在回归问题中是均值和中位数。
59、详细解释SVM算法
SVM是支持向量机的缩写,它是一种监督机器学习算法,可以用于回归和分类。如果你的训练数据集中有n个特征,SVM尝试在n维空间中绘制它,每个特征的值是特定坐标的值。SVM基于所提供的核函数,利用超平面分离出不同的类。
60、支持向量机中的支持向量是什么?
在图中,我们看到细线标记了从分类器到最近的数据点(称为支持向量)的距离(黑色的数据点)。两条细线之间的距离叫做边距。
61、支持向量机的核函数有哪些?
支持向量机中一般使用四种核函数。
线性核、多项式的核、径向基核、Sigmoid 核
62、详细解释决策树算法
决策树是一种监督机器学习算法,主要用于回归和分类。它将数据集分解为越来越小的子集,同时逐步开发相关的决策树。最终的结果是一个具有决策节点和叶子节点的树。决策树可以同时处理分类数据和数值数据。
63、决策树算法中的熵和信息增益是什么?
构建决策树的核心算法有·ID3、C45等。ID3使用熵和信息增益来构造决策树。
熵:决策树是从根节点自上而下构建的,涉及到将数据划分为同构子集。ID3使用熵来检验样本的同质性。如果样本是完全均匀的,那么熵就是0如果样本是等分的,那么熵就是1。
信息增益是基于数据集在属性上分割后熵的减小。构建决策树是关于寻找返回最高信息收益的属性。
完整文章: https://avoid.overfit.cn/post/8a0516dcc791436f893239402bc935ab标签:机器,学习,面试,算法,100,数据,向量,决策树 来源: https://www.cnblogs.com/deephub/p/16415454.html