회사에서 모니터링을 하게되면서 알게되고 애를 많이 먹은 녀석이다.
우선 개념은
로그 수집기
로그를 보내는 쪽은 promtail 이라는 걸 주로 쓴다.
보통 ELK를 쓰곤하지만, 배민에서도 Grafana + Loki로 하기도하고,
좀더 학습곡선이 쉬운 Loki를 채택했다.
grafana에서 LogQl이라는 쿼리를 사용해 조회한다.
내가 느꼈을때 중요한점은 다음과 같다.
로그는 대부분 안읽는 정보들임. 많~~~~이 저장하고 쪼오오끔 읽는게 대부분임. 그래서
1. 정말 필요한정보인가?
-> 하지만 개발하는 입장에서 이를 100% 알기란 쉽지않다. 결국 정말 필요없는 정보를 로그에 남기지 않는게 중요하다.
2. 얼마나 저장하느냐
-> Loki에서는 얼마나 저장할지 loki conifg에서 설정이 가능하다.
BUT txt 형태로 저장되는게 아니라 chunk 형태로 저장이 되어서 사람이 직접 봤을때는 쉽지않다.
3. trace가 잘 되느냐
-> 사실 로그란 에러가 터졌을떄 보는것이라 연관된 서버들과의 추적을 하는게 중요하다
그를 위해서 있는 기구가 있는데.. 다음장에 고고
'TIL' 카테고리의 다른 글
| 서버가 달라도 빠르게 통신하는 방법 ( 쿠버네틱스 ) (1) | 2025.07.29 |
|---|---|
| Node 도커 이미지 메모리 용량 줄이는 방법 (0) | 2025.07.24 |
| HPA 오토스케일링 서버 첫 cpu 스파이크 무시하기 (0) | 2025.07.20 |
| Node JS는 100%싱글스레드가 아니다. (0) | 2025.07.20 |
| VI 있어보이게 써보자.. (0) | 2025.07.04 |