数据仓库、数据开发面经
作者:互联网
目录
一、前言
笔者是19届硕士,以接近硕2的工作经验进行了毕业以来第一次社招的面试,最终结果还不错。经历这两个月的面试,笔者发现在数据仓库、数据开发的面试中,各个公司考察的点大同小异,正好借这个机会写篇文章总结一下,也给大家伙提供一些参考。
笔者的基本面试情况:前期大概准备了半个月到一个月,然后从年后进行面试,断断续续一直到4月中旬,总共面试了两个半月左右。
二、关于内推or猎头or招聘软件的选择
其实针对于工作经验不长的伙伴,不是太建议找猎头,一方面是听说通过猎头的候选人,公司在考察的时候会更加严苛一些,至于通过之后薪酬是否会比以内推方式或者招聘软件方式更高,这个就不得而知了。另一方面,低工作年限的求职者找猎头的意义不大,如果说自己觉得找这种工作信息麻烦,那么也可以通过猎头去和意向公司接触,这个就是仁者见仁智者见智的事情了。
一般来说,笔者是尽量找朋友内推进行面试,考虑的是朋友会更加了解公司情况并且能够及时跟进面试流程。
如果面试公司没有朋友,则通过招聘软件去找,笔者主要通过两个软件:BOSS直聘和脉脉。(在找工作的时候切记屏蔽目前在职公司的hr以及招聘人员,不然万一发现了就尴尬了)
三、面试形式
因为疫情的影响,所以面试一般是以视频面试的形式,有时候也存在语音面试的情况(一般是hr面)。
和校招时不一样,校招时一般是先通过牛客网或者其他网站进行笔试,通过之后再是两轮或三轮电话技术面试,最后再是hr面。
视频面试的感受和现场面还是不一样,感觉现场面试能够发挥的更好一些,也能让面试者和面试官更加了解。
远程面试一般一天一轮面试,hr面可以和最后一轮总监面在一天,加快面试流程。
四、面试流程选择
笔者建议还是先提前准备,然后找一两家公司面试,练练手,摸清楚面试框架之后再慢慢的向自己心仪的公司靠拢。
这种方案的优点就是稳扎稳打,步步为营,后期谈薪资的时候也有参考,缺点就是整体面试战线拉的比较长,可能后期hc比较紧张导致面试难度变高或者面试机会变少。
当然,如果面试者平时就有积累,并且对自己的能力非常有把握,也是可以直接面自己心仪的公司的。
五、面试点
针对于数据仓库、数据研发的面试,一般考察的点如下:
1.自我介绍(需要简洁、清楚、有重点)
2.基础技术能力
- mr的shuffle过程
- group by,join的底层实现
- hadoop的map、reduce由什么决定
- olap引擎优缺点:kylin、druid、ck等
- 列式存储和行式存储的优缺点,orc的特点,orc和parquet的区别
- UDF,UDAF,UDTF区别,是否有过实现经验?如何实现?
- 是否具备实时数仓、实时数据开发相关经验?
- 行转列、列转行
- spark和hadoop区别
- ...
3.数仓建模思想和能力
- 缓慢变化维的种类以及应用
- 数据倾斜以及如何优化?
- 事实表设计步骤
- 事实表分类
- 数仓为什么分层,当前公司的数仓分层模型。
- 目前数仓建模思想有哪些?kimball和Inmon的区别和优缺点是什么?
- 数据质量从哪些方面保证?
- 什么是维度建模?维度建模和宽表的优缺点?
- 星型模型和雪花模型的区别?
- 对数据建模自己的理解和看法(发散型问题)。
- ...
4.简历上的项目
- 项目背景是什么?
- 你的角色是什么?
- 你做了什么?
- 为什么这么做、设计?
- 带来了什么效果和收益?
- 项目中每天的数据量是多少?是否遇到一些问题,如何解决?
- ...
5.编码类问题
- leecode编码题(easy和medium级别)
- sql场景题及其优化(一般考察数据倾斜以及窗口函数等),一般第一问比较简单,后面会针对不同情况进行提问(比如大数据量下如何处理?)
- ...
6.发散型问题
- 未来的规划?
- 为什么出来看机会?
- 工作中团队的分工,你承担了什么角色,基于这个角色你做了什么?有没有超出这个角色职能范围的事情?你的看法是什么?
- ...
六、结尾
最后,祝各位面试的小伙伴都能拿到满意的工作,满意的薪资!
本文属于笔者(a6822342)原创,未经允许,禁止转载。
标签:...,数仓,hr,面经,数据仓库,建模,面试,开发,猎头 来源: https://blog.csdn.net/a6822342/article/details/116939842