TIL

파드 상태별 확인방법 정리

하얀잔디 2026. 1. 31. 13:08

배포하면 종종 파드 에러뜸.

 

CrashLoopBackOff나 Error.. 한번에 보고 뭔지 알게 잠시 정리!!

 

 

CrashLoopBackOff

 컨테이너가 실행은 되는데 바로 죽음(exit) → kubelet이 재시작 반복하다가 백오프(재시작 간격 증가).

 

 

앱 설정/환경변수 누락 → 즉시 종료
설정 파일(ConfigMap/Secret) 잘못됨 (nginx conf 문법, upstream DNS 등)

DB/Redis 등 의존성 연결 실패 후 프로세스 종료
커맨드/엔트리포인트 잘못됨
OOMKilled(메모리 부족)로 죽고 다시 올라옴

 

 

Error

 

: Pod가 정상 Running으로 못 가고 컨테이너 생성/시작 과정에서 오류로 멈춤(원인은 이벤트에 나옴)

 

 

 

ErrImagePull,  ImagePullBackOff 

 

이미지 못당겨오는거..

 

RunContainerError / StartError


: 컨테이너 생성은 됐는데 실행(start) 단계에서 실패 (런타임/권한/커맨드 문제 등)

주 원인

  • 실행 파일 권한 없음
  • entrypoint가 존재하지 않음

 

ContainerCreating이 오래 지속

: 컨테이너 실행 전 단계가 막힘

주 원인

  • 이미지 pull이 느림/막힘
  • PVC 바인딩/마운트 지연
  • CNI 문제(파드 네트워크 붙이기 실패)
  • 노드 문제(디스크 full 등)

 

1) 파드 상태 보고

 
kubectl -n <ns> get pod -o wide

2) Describe로 상태보고

 
kubectl -n <ns> describe pod <pod> # 맨 아래 Events가 결론임

3) Crash면 무조건 --previous

 
kubectl -n <ns> logs <pod> -c <container> --previous

4) 최근 이벤트 정렬해서 보기

 
kubectl -n <ns> get events --sort-by=.lastTimestamp | tail -50