728x90
반응형
https://oliveyoung.tech/2026-03-30/chaos-host-level/
이 글은 올리브영 테크블로그에서 발행한 시리즈물로, 인프라의 직접적인 고장을 유도하여 시스템의 탄력성을 검증하는 Host Level 카오스 엔지니어링의 실전 사례를 소개합니다. 기술진은 DB나 서버 같은 핵심 인프라를 의도적으로 차단한 뒤, 단순한 시스템 복구를 넘어 고객 경험과 데이터 정합성 측면에서 발생하는 예상치 못한 결함들을 면밀히 분석했습니다. 특히 시스템 로그가 정상일지라도 사용자가 체감하는 서비스는 중단될 수 있다는 점을 강조하며, 이를 바탕으로 장애 영향도 평가 기준과 정기적인 테스트 프로세스를 정립했습니다. 결과적으로 이 과정은 QA의 역할을 코드 검증에서 비즈니스 연속성 확보로 확장시키고, 실제 장애가 발생하기 전 선제적으로 서비스의 생존력을 높이는 데 기여합니다.















728x90
'12. 메일진' 카테고리의 다른 글
| 생성형 AI - 인공지능 챗봇(ChatGPT) - 포스타입, RAG 기반 AI 챗봇 '포스펙터'와 '쿼카' (0) | 2026.04.28 |
|---|---|
| 인공지능 - 합성 데이터 (Synthetic data) - 구글, Simula 프레임워크 (0) | 2026.04.28 |
| 빅데이터 - DW - OLAP - 토스(TOSS), Resource Group으로 멀티테넌트 워크로드 격리하기 (0) | 2026.04.27 |
| 클라우드 컴퓨팅 - 카오스 엔지니어링(Chaos Engineering) (0) | 2026.04.27 |
| DB 유형 - 벡터 DB - AI 에이전트 전용 관리형 메모리 서비스, '인그램(Engram)' (0) | 2026.04.27 |


