본문 바로가기

Project/Error Management8

[Error Management] 장애 발생 대응 - 장애가 발생하였다. 왜 일어났을까? 어떻게 할까? 1) 하드웨어 / System / OS 등의 장애 2) Network 장애 - Transaction 장애 3) Database 장애 - PC 전원이 뽑히거나(아주 예외적인 case) server에 이상이 생겨 Database를 호출하지 못해 발생하는 장애 4) Code 장애 - 대응보다 태도가 중요한데 Line, Kakao 말고는 태도 관련하여 언급한 이가 없어 적는다. - 사람이 하는 일이기에 장애는 반드시 발생한다. 문제는 장애 발생시 책임을 추궁하는 문화다. ==> 누가 장애를 발생시켰는지 git log 를 샅샅이 뒤지거나, 몹시 갈구는 해악, 장애가 해결되어도 뒤끝있게 야근 종용 등. 그런 회사는 다음 날 퇴사하자. 당신의 인생에 단 1도 도움.. 2022. 8. 5.
[Error Management] 카카오톡 눈배경 에러 사건 1) QA 과정 중 QA 옵션만 켜야했는데, CBT 쪽도 켜져서 담당자가 당황. 2) 당황한 나머지 CBT 옵션을 끄니 리얼환경이 켜짐 3) 한여름에 카톡 배경으로 눈이 내리기 시작! - 담당자는 장애 리포트 작성(Operation Error) - 망 분리의 필요 @@ [망 분리] - 공공기관이나 기업에서 인터넷과 완전히 격리된 환경인 채로 업무를 볼 수 있도록 망(Network) 를 분리 - 망 분리 환경에서는 인터넷과 연결되지 않은 폐쇄 network에서 작업하게 됨 - 망 분리를 하면 공격자가 internet을 통해 사용자 pc에 침입하여도 주요 정보가 담긴 system에는 접근 불가 - 반대로 망 분리를 통해 system의 주요 정보를 외부로 유출하는걸 방지 - pc 2대를 사용하는 물리적 망분리.. 2022. 7. 26.
[Error] ATM 이중인출 Error 발생 실제 사례 atm에서 어떤 사용자가 이중인출하여 갔다. 은행에서 항의가 들어와 문제를 찾아보니 서버, DB, OS, 네트워크, 하드웨어 등 시스템에 문제는 없었다. 문제 발생의 원인인 프로그램은 무슨 문제가 있었던 것인가? 8-90년대에 발생한 문제임을 감안하여 생각할 것(1금융권에서 발생) * 전제 1 : ATM 사용자의 잔고는 1천만원 이었다. 사용자는 잔고가 부족함에도 2천만원을 인출하였으나 프로그램 및 시스템에 장애 발생은 없었다. * 전제 2: 이중인출은 1천만원이 각각 다른 process에서 2번 발생한 것이다. 인출 + 인출과 같은 비정상적인 process가 아니다. 1천만원을 입력하였더니 2천만원이 나오는 error도 아닌 셈. * 전제 3 : 현재 ATM 시스템은 모든 과정을 마쳐야만 카드를 뺄 수.. 2022. 5. 27.
[Error] 이중 결제 오류가 발생하는 경우 with 은행 전산 Case 은행의 전산 시스템에서 이중(중복) 인출로 인한 Error Case를 알아본 것들을 정리했다. 은행 뿐 아니라 결제시스템을 다루는 곳이라면 어디든 주의할만한 사항이라고 생각함 1) 전산 직원이 결제일에 해당 달의 결제 정보를 입력하며, 지난 달의 결제 정보를 다시 입력하여 이중인출 발생 2) 정상 결제가 되었으나,담당 직원이 파악하지 못해 은행에 재인출 요구 => 중복 인출 발생 3) 기업과 은행 간 대금인출 시스템이 복잡하여 입금 정보 확인 시간과 해당 기업의 연체 확인 시간이 차이가 날 경우 4) 전산 시스템을 새로 교체한 것이 기존 시스템과 충돌을 일으켜 중복 인출 5) 실제 인출되지 않았으나 프로그램 권한으로는 인정되어 인출된 것처럼 보이는 경우 => 몇 달 즘 안에 권한 오류로 뜬 부분은 삭제된.. 2022. 5. 27.