배포하면 종종 파드 에러뜸.
CrashLoopBackOff나 Error.. 한번에 보고 뭔지 알게 잠시 정리!!
CrashLoopBackOff
컨테이너가 실행은 되는데 바로 죽음(exit) → kubelet이 재시작 반복하다가 백오프(재시작 간격 증가).
앱 설정/환경변수 누락 → 즉시 종료
설정 파일(ConfigMap/Secret) 잘못됨 (nginx conf 문법, upstream DNS 등)
DB/Redis 등 의존성 연결 실패 후 프로세스 종료
커맨드/엔트리포인트 잘못됨
OOMKilled(메모리 부족)로 죽고 다시 올라옴
Error
뜻: Pod가 정상 Running으로 못 가고 컨테이너 생성/시작 과정에서 오류로 멈춤(원인은 이벤트에 나옴)
ErrImagePull, ImagePullBackOff
이미지 못당겨오는거..
RunContainerError / StartError
뜻: 컨테이너 생성은 됐는데 실행(start) 단계에서 실패 (런타임/권한/커맨드 문제 등)
주 원인
- 실행 파일 권한 없음
- entrypoint가 존재하지 않음
ContainerCreating이 오래 지속
뜻: 컨테이너 실행 전 단계가 막힘
주 원인
- 이미지 pull이 느림/막힘
- PVC 바인딩/마운트 지연
- CNI 문제(파드 네트워크 붙이기 실패)
- 노드 문제(디스크 full 등)
1) 파드 상태 보고
kubectl -n <ns> get pod -o wide
2) Describe로 상태보고
kubectl -n <ns> describe pod <pod> # 맨 아래 Events가 결론임
3) Crash면 무조건 --previous
kubectl -n <ns> logs <pod> -c <container> --previous
4) 최근 이벤트 정렬해서 보기
kubectl -n <ns> get events --sort-by=.lastTimestamp | tail -50
'TIL' 카테고리의 다른 글
| CKA용 deploy update, rollback 명령어 정리 (0) | 2026.01.27 |
|---|---|
| 서버 성능 최적화 -> 미들웨어를 보자 (0) | 2026.01.27 |
| 해놓을 명령어 및 static pod 문제 (0) | 2026.01.26 |
| 클러스터 여러개를 조종가능? (0) | 2026.01.26 |
| 클라이언트 로그를 서버에서 받아보자. 어떻게? (0) | 2026.01.23 |