728x90
반응형

https://oliveyoung.tech/2026-03-30/chaos-host-level/

 

이 글은 올리브영 테크블로그에서 발행한 시리즈물로, 인프라의 직접적인 고장을 유도하여 시스템의 탄력성을 검증하는 Host Level 카오스 엔지니어링의 실전 사례를 소개합니다. 기술진은 DB나 서버 같은 핵심 인프라를 의도적으로 차단한 뒤, 단순한 시스템 복구를 넘어 고객 경험과 데이터 정합성 측면에서 발생하는 예상치 못한 결함들을 면밀히 분석했습니다. 특히 시스템 로그가 정상일지라도 사용자가 체감하는 서비스는 중단될 수 있다는 점을 강조하며, 이를 바탕으로 장애 영향도 평가 기준과 정기적인 테스트 프로세스를 정립했습니다. 결과적으로 이 과정은 QA의 역할을 코드 검증에서 비즈니스 연속성 확보로 확장시키고, 실제 장애가 발생하기 전 선제적으로 서비스의 생존력을 높이는 데 기여합니다.

 

Application Level은 애플리케이션 코드를, Host Level은 인프라 자체를 대상으로 합니다.
테스트 목표부터 QA 관점의 발견, 조치 결과까지 한눈에 정리한 흐름도

728x90
Posted by Mr. Slumber
,