정부24 장애 원인 그리고 가장 큰 문제.

찢는거니 작성일 23.11.28 00:06:37
댓글 5조회 13,282추천 12
cd5a857208045cdda7c5f12211ca93bf_773856.png

 

https://www.boannews.com/media/view.asp?idx=124129

 

IT인들이 자주 보는 뉴스 사이트(보안뉴스) 기사 퍼 왔습니다.

(보안뉴스는 정치적 성향이 없는 순수 IT보안에 관련 된 뉴스만 다룹니다.)

 

일단 기사부터 짚고 넘어가 볼게요

뉴스를 요약하면 광주센터-대전센터를 연결하는 라우터의 포트 3개가 불량이였다.

 

이건 말이 안 됩니다.

우선 포트 3개가 동시에 불량이 발생할 확률은

사람이 길 가다가 번개를 맞았는데, 용케 살아서 다시 걸어가는데 또 번개를 맞을 확률쯤 될 것 같습니다.

업계 종사자들은 이 포트 불량을 매우 빈번하게 겪습니다. 

근데 이건 1개의 불량이고 동시에 사용하고 있던, 멀쩡하던 포트가 3개가 불량이 된다?

이런 건 단 한 번도 보지도, 듣지도 못 했습니다.

99.99999999999999%의 확률로 구라입니다.

 

그럼 왜 이런 발표가 나왔을까? 추론을 해봅니다.

추론을 위한 근거 2가지를 먼저 설명드립니다.

 

근거1: 국가정보자원관리원의 네트웍을 유지보수 하는 업체에 능력자가 없다

 네트웍 유지보수를 하는 업체의 가장 윗대가리의 직함을 흔히 PM이라고 합니다. (팀장 비스무리함)

 근데 이 PM은 해당 망 구성 전체를 이해하고 있어야만 합니다.

 

eea839a878e31fa6a98a55e9fbeb6d56_128661.png

 

(실제 정부24관련 망은 이 구성보다 대략 10배쯤 크고, 복잡하게 거미줄처럼 얽히고 섥여 있음)

 

대충 이런 구성이 있다면 각 장비별로 역할과 통신의 흐름을 파악하고 있어야 하고

장애(문제)가 발생했을때 각 장비의 담당자를 불러다 놓고 전체 회의를 주관하면서

원인을 파악해 나가는 절차를 밟아야 합니다. 일종의 리딩이라고 볼 수도 있습니다.

근데 이 리딩을 하려면 복잡한 망을 이해하고 있어야 하며, 해박한 지식과 경험이 본 바탕이 되어야 합니다.

당연히 업계에서 이런 사람들은 몸 값이 비쌉니다.

들려오는 풍문에 의하면 대전.. 저 곳에서는 최근 비싼 몸 값을 하는 분이 나가고 없고 다른 분이 왔다고 합니다

(이게 올해인지, 작년인지 정확한 시점은 모름)

왜 그랬을까요? 유지보수를 위탁받은 회사에게 지불하는 금액은 매년 똑같거나 오히려 줄어들게 됩니다.

근데 유지보수 업체의 직원들의 연봉은 매년 올려줘야겠죠?

유지보수 금액은 정해져 있고 인원 수도 딱 정해져 있습니다. (무조건 10명 이상은 채워라 등)

1년 유지보수 금액이 10억이라고 가정한다면 직원들 연봉을 올리기 위해서

매년 중간급, 아래급의 직원들이 나가고 그 보다 호봉이 낮은, 즉 연봉이 낮은 직원들이 새로 들어오게 됩니다.

전제 조건은 가장 윗대가리 PM급 1~2명은 유지를 해야 이게 로테이션이 돌게 됩니다.

PM연봉은 8천.. 9천.. 1억 상승이 되는데(1년에 1천만원 오른다는 얘기는 아님)

중간이나 아래급의 평균 연봉이 계속 낮아져야만 합니다.

이게 오래 지속되면 어느 시점에 한계가 오고 PM이 나가야만 하는 시점이 온것 같네요

 

네트워크 구조를 가장 잘 파악하고 있는 사람이 나갔습니다.

대신 들어온 사람은 그 보다 낮은 능력이였을 겁니다. (낮은 연봉)

운 좋게 장애가 발생하지 않았다면 그 사람도 시간이 지나면서 적응해 나갔겠지만

복잡한 망 구조를 미처 적응 또는 이해하기도 전에 장애가 발생한 것으로 보입니다.

그래서 대응 능력이 미흡했을 것이다.

원인 파악이 늦었을 것이다.

 

근거2: IT 업계에서 장애가 발생하면 원인을 파악하고, 그 원인을 제공한 사람 또는 업체는

       그 원인에 대한 책임을 지게 됩니다.

        그 책임은 금전적인 것 일수도 있고, 단순 질타 내지는 경고일수도 있습니다.

        근데 이번처럼 뉴스에 대대적으로 떠들면서 국가적 재난에 준하는 장애라면?

        이건 누구 하나 총대 매고 도게자 박아야 하는 상황이였습니다. 

        자, 이런 상황에서 현장의 대가리급들은 빠르게 머리를 굴립니다.

        누구 하나 다치지 않고(책임지지 않고) 평화롭게 해결될 순 없을까?

       즉, 누구의 책임도 아닌 천재지변과 같은 어쩔 수 없던 상황이였다-라고 할 순 없을까?

        뭐 이런거죠 

        비단 IT뿐만 아니라 정치싸움 좀 하는 기업에선 흔할꺼라고 봅니다.

 

결론

 1. 근거1에 의거하여 대응 능력이 미흡해서 원인 파악이 늦었을 것이다.

 2. 원인을 딱 확인해 보니 잘못한 사람(또는 업체)이 있었다

 3. 근거 2를 충족할 수 있는 문제의 원인 또는 핑계꺼리를 찾다 보니………. 유레카!

    라우터 포트3개가 불량이였네! 

 

이게 제 생각입니다.

 

가장 큰 문제는 유지보수 예산이라는 것이 매년 고정된 금액이라는 것 

또는 악착같이 줄일려고만 한다는 것

그로 인한 운영의 불안정에 의한 것이라고 봅니다.

 

끗.

 

        

        

 

찢는거니의 최근 게시물

정치·경제·사회 인기 게시글