ㅁ 풀어야 할 문제
서버 장애가 발생하면 빨리 복구해야 한다. 장애 원인은 여러 가지가 있지만, 디스크에는 문제가 없는 경우가 많다. 그럴 때는 문제가 없는 디스크를 다른 서버에 장착하면 바로 복구할 수는 있지만, 데이터 센터 작업이나 서버의 준비, 디스크 교체 등으로 시간이 소비 된다.
ㅁ 해결/패턴
클라우드에서의 서버는 가상 서버이고 교체 가능한 가상 디스크를 이용할 수 있다. 가상 서버에 장애가 발생하면, 장애가 발생한 가상 서버의 디스크를 다른 가상 서버에 장착하여 장애 복구를 할 수 있다
물리 서버와 비교하면 서버 준비와 엔지니어가 이동할 필요가 없어 짧은 시간에 복구가 가능하다.
EBS는 EC2 인스턴스와 독립적으로 존재하며, 다른 EC2 인스턴스에 장착할 수 있고 장애 발생 시 다른 EC2를 가동하여 EBS를 장착한다.
- EC2에 EBS를 연결하고 평상시에는 그 쪽에 데이터를 보관한다.
- EC2의 장애 발생 시 같은 AMI에서 가상 서버를 가동하여 장애가 발생한 EC2의 데이터용 EBS를 새로운 EC2에 장착한다.
- 미들웨어나 파일 시스템을 재설정하고(예를 들어, 최신 데이터의 심볼릭 링크 등) 장애 이전의 상태로 복구한다.
- 이런 처리는 감시 소프트웨어(Nagios, Zabbix, Heartbeat 등)을 이용하여 자동화할 수 있다.
- EC2의 장애 직전 상태로 복구가 가능하다.
- 루트 디스크를 교환하여 시스템(OS) 복구도 짧은 시간에 가능하다.
- EBS의 장애도 고려하여 스냅샷 등의 백업도 해야 한다.
- Floating IP 패턴과 같이 사용하면 EBS도 바꾸면서 고정 IP를 바꿀 수 있다.
'AWS Design Pattern > 운영 유지 보수 패턴' 카테고리의 다른 글
Web Storage Archive - 대용량 데이터 아카이브화 (0) | 2021.02.05 |
---|---|
Monitoring Integration - 모니터링 툴 일원화 (0) | 2021.02.05 |
Stack Deployment - 서버 군의 템플릿화 (0) | 2021.02.05 |
Cloud DI - 변경이 많은 부분의 분리 (0) | 2021.02.05 |
Bootstrap - 부팅 설정의 자동 수집 (0) | 2021.02.05 |