개발 slecs

쇼핑몰 WAS 모니터링 타겟 추가로 운영 가시성 확보

목차

쇼핑몰 플랫폼 WAS 모니터링 타겟 추가 (...)

2026-04-03에 관찰 가능성 스택에 기능을 추가하거나 설정을 개선했음.

운영 중 서버 상태를 실시간으로 확인하려면 메트릭 수집 구조가 안정적이어야 함. Spring Boot Actuator에서 /actuator/prometheus 엔드포인트로 메트릭을 노출하고, Prometheus가 주기적으로 긁어가는 구조로 돼 있음.

작업 내용

  • Prometheus 타겟 설정 추가 또는 수정
  • Grafana datasource 또는 대시보드 갱신
  • Zipkin/Tempo 연동 endpoint 조정
management:
  endpoints:
    web:
      exposure:
        include: health,prometheus
  metrics:
    export:
      prometheus:
        enabled: true

Actuator 엔드포인트는 외부에 노출되면 안 되니까 IP 필터로 허용 목록만 통과시키도록 별도 필터를 달아뒀음. 설정 파일에서 YAML 공백 파싱 문제로 한 번 막혔었는데, trim() 처리 추가하고 해결됐음.

작업 규모는 크지 않았지만 운영 안정성을 위한 필요한 변경이었음. 이런 작은 수정들이 쌓여서 전체 시스템의 신뢰도를 높임.

Grafana 대시보드 구성 팁

  • JVM 메모리, GC, 스레드 풀은 기본으로 봐야 할 지표
  • HTTP 요청 수, 레이턴시 p95/p99는 서비스 수준 확인에 필수
  • 알림 설정: 임계치 초과 시 슬랙 알림 연동하면 야간 장애도 빠르게 인지 가능
  • Loki 연동으로 특정 에러 로그 발생 시 대시보드에서 바로 확인 가능

다음

댓글 0

첫 댓글 달아줘.