...
코드 블럭 |
---|
/dev/nvme{i}n1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
unsafe_shutdowns 28 10 10 10 16 16 16 17 17 15 17 17 14 18 16 10
num_err_log_entries 35 168 168 168 196 191 191 181 181 181 191 181 186 181 267 168
critical_warning 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
media_errors 0 0 0 0 5 0 0 0 0 0 0 0 0 0 76 0 |
https://santander.co.kr/122
코드 블럭 |
---|
1. available_spare < available_spare_threshold 이 되면 위험 , spare 영역 어쩌구 저쩌구
2. percentage_used 100% 넘어가면 위험함, 밴더사별로 내놓은 워런티? 수명? 뭐 그런거임
3. controller_busy_time 분단위인데.... 바쁘게(I/O 큐가 밀려있을때) 움직인 시간... 대기작업이 많이 있는경우 올라가는거라 정상인것같다.(정확하지 않다.) 0인 서버 못찾음
4. unsafe_shutdowns 말그대로임, 서버 강종하지말자.
5. media_errors 는 1 되면 배드섹터 감지된거니까 교체해야함
nvme는 모니터링해야되는게
1. available_spare < available_spare_threshold
2. percentage_used > 100
3.media_errors > 0 |