시스템 모니터입니다.
최근 24시간 동안 발생된 2번의 긴 일시 점검 및 장애에 대해 유저들에게 불편 끼쳐 드려서 죄송합니다.
2월 6일 17:00시 근처에 메모리 오류가 발생하면서 데이터베이스 서버의 데이터가 깨지는 오류가 발생했습니다.
그로 인해 이중화된 하위 데이터베이스 까지 문제가 생겼고,
응급으로 복구 조치를 위해 약 2시간 동안 임시 점검하면서 복구 작업 진행하고, 신규 글 및 댓글에 대한 검색 서비스 등은 꺼 놓고 정상적인 최소한의 서비스에 필요한 요건으로 오후 18:50시에 서비스를 다시 오픈 했습니다.
그러나 하위의 이중화 데이터베이스는 여전히 깨져서, 2월 7일 새벽 04:05시 부터 약 새벽 05:30 까지 임시 점검을 해서 하위 데이터베이스 동기화 작업을 성공적으로 마치고 신규 글 및 댓글에 대한 검색 포함한 모든 서비스를 다시 오픈 했습니다.
과거에도 유사한 데이터베이스 문제로 서비스 점검이 더 길게 있던 적이 있었는데,
추후 관련 부분을 예방하기 위해 지금 처럼 이중화 서비스 및 백업을 지속적으로 하고,
유사 문제에 의한 피해를 미래에는 장애 시간을 줄이기 위해, 이중화 뿐만 아니라 서비스 장애에는 이중화 데이터베이스로 자동 복구가 가능하도록 고급 기법들을 적용할 예정입니다.
유저들에게 더 안정적인 서비스를 제공하도록 노력하겠습니다.
감사합니다.