왜 했냐
서비스 느리다는 얘기 나오면
어디가 느린지 바로 못 찾으면 답 없음
로그에서
- 어떤 API가 느린지
- 언제 느린지
- 얼마나 느린지
바로 뽑을 수 있어야 함
그래서 OpenSearch로 Top N 분석함
오늘 한 거
- 특정 시간대 기준으로 조회
- request_time 기준 느린 요청 찾기
- Top 50 정렬
- URI별 bytes 합으로 트래픽 분석
- /socket.io/ 같은 노이즈 로그 제외
Discover
로그 하나씩 보는 용도
→ 디버깅할 때 좋음
Visualize
통계 보는 용도
→ Top N, 평균, 합계 이런거 보기 좋음
실무에서는 둘 다 씀
느린 요청 Top 50 뽑기
방법 (Discover 기준)
- 시간 필터 설정
- 정렬 기준을 request_time으로 변경
- 내림차순(desc) 정렬
러면 느린 요청부터 쭉 나옴

'TIL' 카테고리의 다른 글
| 오늘 느낀 것 — 개발보다 더 중요한 것 (0) | 2026.03.20 |
|---|---|
| DB CPU가 미친듯이 튀었는데, 범인은 DB가 아니었다 (0) | 2026.03.18 |
| Terraform 쓰는 이유 (0) | 2026.03.16 |
| Ansible 쓰는이유 (0) | 2026.03.16 |
| 트래픽 몰려도 멀쩡히 웹서버 rollout을 해보자 (0) | 2026.03.13 |