데이터 엔지니어 이직 준비법 (4) - 기술면접 준비
기술면접 질문 준비 리스트
아래 질문은 실제로 제가 이직을 준비하면서 준비했던 데이터 엔지니어용 질문 모음입니다. 이직을 준비하시는 모든 분들께 도움이 되었으면 좋겠네요 :)
또한 아래 질문은 제 이력서 및 포트폴리오를 기반으로 준비된 질문입니다. 면접 준비자 분의 이력서에 맞춰서 추가적으로 질문을 생성해서 준비해보는 것을 강력 추천 드립니다 !!
공통질문
-
간단하게 자기소개 해주실 수 있나요? (핵심역량, 주요성과, 지원동기)
-
우리 회사에 지원하게 된 동기가 뭔가요?
-
이직하려는 이유가 뭔가요?
-
이전 회사에서 가장 힘들었던 점이 무엇인가요?
-
해당 직군의 매력이 무엇이라고 생각하나요?
-
해당 직군에서 본인의 장점은?
-
해당 직군을 하면서 이루고자 하는 목표는?
-
왜 저희가 지원자를 뽑아야 하나요?
-
지원자의 장점과 단점은?
-
데이터 엔지니어란 뭐라고 생각하시나요?
-
전 직장에서 어떤 역할을 맡아서 진행하셨나요?
-
가장 기억에 남는 프로젝트가 무엇인가요?
-
프로젝트 도중에 갈등 상황이 있었던 적이 있나요? 해결방안은 무엇인가요?
-
했던 프로젝트에서 보완하고 싶은 내용이 있나요?
-
그렇다면 위를 어떻게 보완할 수 있을까요? 아이디어를 떠올려 보셨나요?
-
회사 성장이 중요한가요 자신의 성장이 중요한가요?
-
k8s가 무엇인가요?
-
k8s를 썼을 때의 장점은 무엇인가요?
-
그렇다면 도커는 무엇인가요?
-
그럼 도커를 사용했을 때 장점이 뭔가요?
-
CI/CD가 무엇인가요?
-
클라우드를 사용함으로써 얻는 이득이 뭐라고 생각하시나요?
-
ETL과 ELT의 차이에 대해 설명해보세요
-
Data Warehouse가 뭐야?
-
Data Lake와 Warehouse의 차이가 뭐야?
-
RDBMS와 NoSQL의 차이가 뭐야?
-
ACID가 뭐야?
-
Airflow란 무엇인가요?
-
Hadoop Ecosystem에 대해 알고 있나요?
-
Spark란 무엇인가요?
-
입사해서 진행해보고 싶은 프로젝트가 있나요?
-
10년 뒤 어떤 개발자가 되고 싶나요?
-
마지막 포부
Event Pipeline 관련 질문
-
Kafka란 무엇인가?
-
Kafka에서 consumer의 수를 파티션의 수보다 많이 할당하지 않는 이유가 뭐야?
-
카프카 컨슈머 그룹의 리밸런싱 과정에 대해 설명해줘
-
컨슈머의 파티션 할당 전략에 대해 설명해줘
-
Kafka에서 페이지 캐시를 하는 방법에 대해 알아?
-
Kafka에서 Zookeeper의 역할이 뭐야?
-
Kafka에서 leader와 Follower의 각각 역할이 뭐야?
-
그럼 만약 리더의 데이터가 아직 팔로워들에게 동기화 되지 않았는데 리더가 crash나면 어떡해?
-
Kafka에서 리더와 팔로워 간의 replication 동작에 대해 설명해줘
-
리더에포크의 역할에 대해 알아?
-
Zookeeper가 leader elect하는 과정을 설명해줘
-
knative가 뭐야?
-
knative serving이 뭐야?
-
istio가 뭐야?
-
Service Mesh Architecture가 뭐야?
-
ELK가 뭐야?
-
Elastic Search는 어떻게 검색을 빠르게 수행하는거야?
-
Events Pipeline을 관리할 때 Kafka를 어떻게 사용하였는지 한번 자세히 설명해주실 수 있나요?
-
Kafka와 Kinesis의 장단점이 뭐라고 생각하시나요?
-
ELK를 어떻게 구축하셨는지 설명해주세요
-
Prometheus의 alert manager를 활용하여 어떤 방식으로 alert를 발생했는지 설명해주세요
-
Prometheus가 뭔가요?
-
Terraform과 pulumi의 차이?
실시간 데이터 활용 관련 질문
-
ksql이 무엇인가요?
-
ksql을 사용하실 때 어떤 제약을 느끼셨나요?
-
kafka streams를 사용하면 어떻게 ksql에서의 제약을 해결할 수 있나요?
-
kafka streams를 활용하여 어떻게 pipeline을 구축하셨나요?
-
데이터 타입으로 avro를 사용하셨는데 avro가 뭔가요?
-
avro가 데이터의 스키마가 시간이 지나면서 변할 수 있음을 고려하여 설계되었는데, 어떻게 오래된 스키마로 직렬화된 데이터도 새로운 스키마로 역직렬화 할 수 있는지에 대해 알려줘
Infrastructure 관련 질문
-
수행했던 트러블슈팅 중 가장 기억 남는 트러블슈팅?
-
IaC의 장점과 단점이 뭐라고 생각하는가?
-
Blue Green Deployment에 대해 설명해주세요
-
Blue Green을 선택한 이유가 있나요? 다른 Rolling update나 Canary나 다른 배포 방법도 있을텐데
-
데이터 백업 및 clean은 어떤식으로 하신건가요?
-
PostgreSQL의 장점?
-
인덱스는 크게 Hash index와 B+ tree index가 있습니다. 이것은 무엇일까요?
-
Clustered index와 unclustered index는 뭐야?
-
인덱스 scan 방식은 무엇이 있나요?
-
인덱스 설계시 NULL값은 고려되어야 할까요?
-
Nested Loop join은 무엇인가요?
-
MySQL에서 대량의 데이터를 insert해야하는 경우엔 어떻게 해야할까요?
-
RDB의 char과 varchar의 차이는 무엇일까요?
-
구글 BigQuery나 AWS의 Redshift는 기존 RDB와 무슨 차이가 있길래 빠를까요?
-
쿼리의 성능을 확인하기 위해 어떤 쿼리문을 작성해야 할까요?
-
MySQL이 느리다는 신고가 들어오면 어떤걸 확인하고 조정하시겠나요?
-
동작하는 MySQL에 alert table을 하면 안되는 이유를 설명해주세요. 대안을 설명해주세요
-
빡세게 동작하고 있는 MySQL을 백업뜨기 위해서는 어떤 방법이 필요할까요?
-
MapReduce란 무엇인가요?
-
Spark가 Hadoop보다 빠른 이유를 I/O 최적화 관점에서 생각해봅시다.
-
RDD가 뭐야?
-
동시성(concurrency)와 병렬성(parallel)의 차이가 뭐야?
-
동기와 비동기의 차이?
-
싱글스레드/멀티스레드 장단점
-
스레드/프로세스 차이