CloudWatch란? (Amazon CloudWatch)
CloudWatch는 AWS 리소스와 애플리케이션의 메트릭, 로그, 이벤트를 수집·모니터링하고 알람까지 제공하는 통합 관측(Observability) 서비스다.
1) CloudWatch가 왜 필요한가 (배경)
서버를 띄우는 것만으로는 서비스가 아니다.
- 지금 정상인가?
- 언제 느려졌는가?
- 어디서 장애가 났는가?
이걸 수치와 로그로 확인해야 운영이 가능하다.
CloudWatch는:
- 상태 가시화
- 이상 징후 감지
- 자동 알림
을 담당한다.
2) CloudWatch 한 줄 정의
CloudWatch는 AWS 리소스와 애플리케이션의 상태를
메트릭·로그·이벤트로 관측하고 알람을 제공하는 모니터링 서비스이다.
3) CloudWatch의 핵심 구성 요소
(1) Metrics (지표)
- 시간 단위 수치 데이터
- 대표 메트릭:
- EC2: CPUUtilization
- ALB: RequestCount, TargetResponseTime
- RDS: FreeableMemory
(2) Logs (로그)
- 애플리케이션 로그
- 시스템 로그
- CloudWatch Agent 필요
/var/log/messages
/app/logs/app.log
(3) Alarms (알람)
- 메트릭 기준 초과 시 알림
- SNS 연동 가능 (메일/Slack)
CPU > 80% for 5 minutes → Alarm
(4) Events (EventBridge)
- 상태 변화 이벤트
- 예:
- EC2 종료
- ASG Scale Out
4) CloudWatch 동작 흐름
[EC2 / ALB / RDS]
↓
Metrics / Logs
↓
[CloudWatch]
↓
[Alarm]
↓
[SNS / 자동 대응]
5) 실무에서 가장 많이 쓰는 CloudWatch 시나리오 ⭐
✅ EC2 모니터링
- CPU, 메모리, 디스크
- 장애 조기 감지
✅ ALB 모니터링
- 요청 수 급증
- Target 오류 비율
✅ ASG 연동
- CPU 기준 자동 Scale Out
6) CloudWatch Logs 실무 포인트
로그 수집 방식
- CloudWatch Agent 설치
- 로그 그룹/스트림 관리
로그 활용
- 장애 원인 분석
- 지표 추출(Metric Filter)
7) CloudWatch Alarm + ASG 연계
CPU > 70%
↓
CloudWatch Alarm
↓
ASG Scale Out
8) 비용 주의 사항 ⚠️
- 로그 저장량
- 메트릭 수
- 알람 개수
👉 로그 보관 기간 설정 필수
9) CloudWatch에서 자주 하는 실수 ❌
❌ 로그 무제한 저장
❌ 메모리/디스크 모니터링 안 함
❌ 알람만 만들고 테스트 안 함
'Infra&Cloud > AWS' 카테고리의 다른 글
| AWS-ELB(Elastic Load Balancing) (0) | 2026.02.08 |
|---|---|
| AWS-Systems Manager(SSM) (0) | 2026.02.08 |
| AWS-ROUTE 53 (0) | 2026.02.08 |
| AWS-Cloud Front (0) | 2026.02.05 |
| AWS-ASF(Auto Scaling Group) (0) | 2026.02.05 |