数据开发 专题汇总

数据开发 面试经验分享列表,共99

| 网上申请
面试过程:

关于上一家项目的工作内容,我主要负责哪些具体职责?能否详细描述一下我在项目中的角色定位和工作范围?具体包括哪些任务和目标,如何协调团队合作,以及我在项目中承担的关键责任是什么?

面试官问的面试题:

关于数仓设计和实施:“你在数据仓库(数仓)项目中具体负责哪些任务?你如何设计ETL流程以及确保数据的质量和一致性?”
Oracle数据库相关问题:“请介绍你在Oracle数据库方面的经验,如何优化SQL查询性能?有没有参与过Oracle数据库的迁移或升级项目?”
数据建模:“你在数据仓库项目中如何进行数据建模?能举例说明你使用的建模方法和工具吗?”
数据集成:“在数据仓库的实现过程中,你如何进行不同数据源的集成,如何处理数据的清洗与转换?”
技术细节:“你有使用过哪些Oracle特性(如分区表、索引、存储过程等)来提升性能?能否举一个实际的优化案例?

赞一下(0) 踩一下

| 网上申请
面试过程:

基本情况:双非本非科班,211硕科班
我面试的是暑期实习的数据开发岗位,是在boss上投递的,看了简历之后隔天就约面了,但是因为当时没怎么准备所以一面就挂了,现在看来问的问题都很常规的,分享给大家。

面试官问的面试题:

1.关于我自己的项目拷打,问了有哪些指标,数据源都有哪些,如何构建的
2.数仓分层以及为什么分层
3.spark和Hadoop的区别
4.hive调优了解吗?
然后就是SQL题
1.学生学号id,课程id,成绩score,找出每一个课程中成绩是前三名的学生
2.车辆id,时间戳,每1.3.5.7.秒来一次车,对其分段,分段的条件是这一帧和上一帧相差在10s以内,满足条件的分到一段,然后就可以知道哪一帧数据属于哪一段

赞一下(0) 踩一下

| 校园招聘
面试过程:

小红书的面试感觉难度不低,好多问题其实都不是特别理解在问什么,纯按自己的理解在说,不够总体面试体验还是不错的

面试官问的面试题:

1. 自我介绍之后开始问项目
2.Hadoop 和spark的区别和优劣
3.谈到spark shuffle原理,hashshuffle 和 sortshuffle(这里我描述的不太清楚,说了半天,不知道最后说明白了没)
4.谈谈线程池,阻塞队列有界无界,救急线程
5.JVM内存模型
6.栈溢出的场景和应对方法
7.方法区能不能溢出,如果溢出的话储存的那些类信息怎么办
8.mysql索引设计原则
9算法题:经典两数之和,秒了后 延伸为三数之和
10 反问业务:数据湖技术栈主要为iceberg+flink(这个我确实没想到,以为是hudi)

赞一下(4) 踩一下

1 2 3 4 5   共 5 页