본문 바로가기

대응2

[Linux] 리눅스 서버에서 장애 발생 시 대응 방안 - 리눅스 server에 문제가 생기면 어디서부터 해결할 지 알아보자 - 들어가기 전, sysstat package를 설치하고 가자. (시스템 정보 확인을 위해) $ sudo yum install sysstat $ sudo apt install sysstat 0) Error log 확인 - "dmesg | tail" 로 error log 확인 - dmesg 만 입력하면 모든 커널 msg를 출력하므로, tail 을 넣어 마지막 10줄만 출력하자. - "dmesg -w" 를 입력하면 실시간 로그 확인 가능. $ dmesg | tail [1880957.563150] perl invoked oom-killer: gfp_mask=0x280da, order=0, oom_score_adj=0 [...] [188095.. 2022. 10. 6.
[Error Management] 장애 발생 대응 - 장애가 발생하였다. 왜 일어났을까? 어떻게 할까? 1) 하드웨어 / System / OS 등의 장애 2) Network 장애 - Transaction 장애 3) Database 장애 - PC 전원이 뽑히거나(아주 예외적인 case) server에 이상이 생겨 Database를 호출하지 못해 발생하는 장애 4) Code 장애 - 대응보다 태도가 중요한데 Line, Kakao 말고는 태도 관련하여 언급한 이가 없어 적는다. - 사람이 하는 일이기에 장애는 반드시 발생한다. 문제는 장애 발생시 책임을 추궁하는 문화다. ==> 누가 장애를 발생시켰는지 git log 를 샅샅이 뒤지거나, 몹시 갈구는 해악, 장애가 해결되어도 뒤끝있게 야근 종용 등. 그런 회사는 다음 날 퇴사하자. 당신의 인생에 단 1도 도움.. 2022. 8. 5.