数据科学的面试的一些基本问题总结
作者:互联网
在这篇文章中,将介绍如何为成功的面试做准备的,以及可以帮助我们面试的一些资源。
代码开发基础
如果你是数据科学家或软件开发人员,那么应该已经知道一些 Python 和 SQL 的基本知识,这对数据科学家的面试已经足够了,因为大多数的公司基本上是这样的——但是,在你的简历中加入 Spark 是一个很好的加分项。
对于 SQL,你应该知道一些最简单的操作,例如:
- 从表中选择某些列
- 连接两个表(内连接、左连接、右连接和外连接)
- 汇总结果(总和、平均值、最大值、最小值)
- 在 SQL 中使用窗口函数
- 日期处理
对于 Python,需要了解:
- 处理df(pandas),例如读取、加入、合并、过滤
- 操作日期和格式化日期
- 操作字符串,例如使用正则表达式、搜索字符串包含的内容
- 有效地使用循环
- 使用列表和字典
- 在 Python 中创建函数和类
在你的编程面试中,掌握 SQL 和 Python 是很重要的。
了解数据结构和算法
这是一个重要的问题,可能不像对软件开发人员那么重要,但是对数据结构和算法有很好的理解肯定会让你与众不同。以下是一个好的开始:
- 大O符号
- 二进制搜索
- 数组和链表
- 选择排序
- 快速排序
- 冒泡排序
- 合并排序
- 哈希表
下面进入本文的正题,将介绍一些基本的ML面试相关资料,可以作为笔记收藏
线性回归
我关于线性回归的大部分笔记都是基于《统计学习导论》这本书。
完整文章:
https://avoid.overfit.cn/post/22ca3b67bad14371a1c251a388f1fc4c
标签:总结,开发人员,Python,科学,面试,SQL,排序,连接 来源: https://www.cnblogs.com/deephub/p/16374323.html