[2ch] 얼굴 인식 시스템

금산스님 작성일 14.08.28 01:04:55
댓글 7조회 4,547추천 17

몇년 전, 나는 어떤 기업 소속 연구팀에 속해있었다.

연구팀이라고는 해도 하얀 가운을 입고 화학 약품을 다루거나 하는 일은 아니다.

우리가 맡았던 것은 [카메라를 통한 얼굴 인식 시스템과 그 응용 방법에 대한 연구] 였다.

 


메인 컴퓨터 한 대에 프로그램을 설치하고, 거기에 여러 곳의 CCTV 영상을 수집해 얼굴을 인식시키는 것이다.

그리고 그 자료를 기반으로 [ID:0001은 X->Y->Z의 경로로 이동했습니다.] 라는 기록을 자동으로 작성하는 시스템이었다.

 


다만 그런 시스템 자체는 당시에도 꽤 개발이 진척된 상황이었기에,

차별화를 위해 기본이 되는 얼굴 인식 프로그램에 추가 기능을 집어 넣는 것이 우리 팀의 목표였다

 


최초로 시도한 것은 얼굴 인식을 통해 그 사람의 나이를 추정하는 것이었다.

요즘에는 스마트폰 어플리케이션으로도 널리 알려져 있지만, 기본적인 메카니즘 자체는 일기예보와 비슷하다.

 


미리 각 연령별로 수집한 얼굴을 컴퓨터에 입력해두고,

카메라가 얼굴을 인식하면 수집되어 있는 자료와 비교해 예상되는 나이를 산출하는 것이다.

 


방법은 무척 간단하지만 그럼에도 신뢰도는 높아서,

테스트 단계에서도 적중률은 40%에 육박했고, 최종적으로는 ±8살 정도로 맞추는 수준에 이르렀다.

꽤 재미있기는 했지만, 이 정도는 다른 연구팀에서도 추진하고 있는 프로젝트다.

 


그래서 우리는 조금 더 차별화 될 수 있는 독특한 기획을 만들기 위해 머리를 짜내고 있었다.

다행히 우리 연구팀에는 얼굴 사진과 개인정보의 빅 데이터가 수집되어 있었기 때문에, 여러가지 시도를 해 볼 수 있었다.

이름부터 시작해 학력, 출신지까지..

 


하지만 역시 이름을 예측하는 것은 무리였다.

애초에 데이터화 되기 힘들 뿐 아니라, 각 사람마다 다를 수 밖에 없는 이름을 컴퓨터로 예측하게 하는 것은 불가능했다.

하지만 학력 예측은 중졸, 고졸, 전문대졸, 대졸 4가지 패턴의 단순한 분류였던 덕인지, 50%에 달하는 적중률을 보였다.

 


게다가 출신지 예측의 경우에도 예상 외로 높은 적중률을 보였다.

홋카이도부터 오키나와까지 각 지역 사람들의 얼굴을 분류해 입력하자, 도시별로 10%에 가까운 적중률이 나온 것이었다.

[겨우 10%잖아?] 라고 생각할 수도 있지만, 솔직히 우리에게는 상당히 충격적인 결과였다.

 


나이를 알아맞추는 것은, 사람이 한다고 해도 대충 어느 정도인지 가늠은 할 수 있다.

하지만 과연 10명 중 1명이라는 확률이라도, 얼굴만을 통해 그 사람이 어느 도시 출신인지 맞출 수 있는 사람이 있을까?

나는 어느 정도의 자료만 확보되면 컴퓨터의 예측이 정확할 수 있다는 가설을 내놓고, 한층 더 연구에 몰두하기 시작했다.

 


그러던 어느날, 팀 내에서도 괴짜로 평가받던 A가 [야, 우리 이걸로 남은 인생 예측 같은 거 해볼까?] 라는 제안을 했다.

아무래도 당시 한참 장안의 화제였던 만화 데스노트의 영향을 받았던 것 같다.

하지만 개인정보의 빅 데이터가 구축되어 있다고는 해도, 당연히 여생에 관한 자료 같은 게 있을 턱이 없다.

 


[그거야 세상을 떠난 역사적 인물 사진 중에 언제 찍었는지 확실한 사진으로 자료를 만들면 되지.

 흑백 사진이라도 인식하는 데는 문제 없을 거 아냐?]

물론 컬러 사진에 비하면 인식률 자체는 떨어질지언정, 메카니즘 상 흑백 사진도 큰 상관은 없다.

하지만 그런 제한된 조건이라면 자료의 수가 너무 적다는 게 문제였다.

 


[중요한 건 얼굴이랑 사진을 찍은 날, 그리고 죽은 날이 확실하기만 하면 되는거라구.

 천재지변이나 사고로 죽은 사람 사진 같은 걸 신문에서 찾아서 쓰면 되잖아.]

그런 식으로 자료를 모으면 우발적인 사고나 외부 요인으로 인해 죽은 사람도 자료에 포함되어 버릴텐데..

 

 

[그런 건 어찌되든 상관 없잖아.]

A는 능글맞게 웃을 뿐이었다.

 


당초 내가 여생을 측정하는 시스템 구축이라는 말을 들었을 때 떠올린 것은,

얼굴의 현재 건강 상태를 확인해 언제쯤 자연사할 지를 예측하는 형태였다.

하지만 A가 생각하는 것은 아무래도 길거리 점쟁이나 하는 짓을 컴퓨터에 시키려는 것 같았다.

 


이미 세상을 떠난 사람의 사진을 도구로 사용한다는 것이 조금 꺼림칙하기는 했지만,

그 무렵 우리는 연구에 몰두해 의욕이 넘쳤기에 곧바로 작업에 착수했다.

매일 신문과 뉴스를 뒤적이며 사진을 구해, 죽은 날에서 사진을 찍은 날을 빼서 남아 있는 예정 수명을 산출한다.

 


몇 주 지나지 않아 2000여 건에 달하는 빅 데이터가 구축되었다.

이 정도면 실질적으로 의미 있는 자료량에 도달했다고 판단한 우리는, 시험 운용에 들어가기로 했다.

 


다만 그렇다고는 해도 정답이 있을 수 없는 예측이기에,

오차가 있는지 없는지, 어느 정도나 오차가 나는지는 전혀 알 수가 없다.

 


맨 처음으로 시험 대상이 된 것은 바로 나였다.

시스템을 가동하고, 카메라 앞에 선다.

바로 얼굴에 초점이 맞춰지고, 잠시 계산한 뒤 컴퓨터가 예측치를 뽑아냈다.

 


[60.]

일본 남성의 평균 수명이 80세 전후이고,

당시 나를 포함한 우리 연구진이 모두 20대 중반이었다는 것을 감안하면 그럴듯한 예측이었다.

 


곧이어 다른 멤버들도 하나씩 테스트에 임했지만,

샘플이 적었던 것인지, 아니면 애초에 계획 자체가 잘못됐던 것인지 예측치는 천차만별이었다.

 


[23, 112, 75, 42..]

편차도 클 뿐 아니라 상당히 터무니 없는 수치였다.

그 뿐 아니라 A의 경우에는 무려 0이라는 수치가 나와 버렸다.

 


역시 컴퓨터에게 이런 수치화되지 않은 데이터를 예측하게 하는 것은 무리였나 싶어서 우리는 낙담했다.

하지만 수작업으로 샘플을 2000개나 모았는데, 이대로 폐기시키는 것은 너무 아까웠다.

 


우리는 일단 하룻밤 동안 로그 자동 생성 모드를 켜 놓고,

회사 서버에 들어오는 모든 CCTV 영상을 분석하게 프로그램을 설정했다.

 


다음날 출근해보니 화면에는 수천건이 넘는 얼굴 인식 결과가 출력되어 있었다.

통계를 내보니 흥미로운 결과가 나왔다.

촬영 장소에 따라 추정치의 편차가 엄청나게 컸던 것이다.

 


예를 들면 자료 영상 중 초등학교에 설치된 CCTV 영상의 추정 여생은 106년이었다.

전체 평균인 46년에 비해서 훨씬 높게 나온 것이었다.

 


반대로 처음으로 평균보다 낮은 수치를 기록한 것은 고속도로에 설치된 CCTV로, 평균 38년이라는 수치가 나왔다.

그런 식으로 평균 여생이 가장 낮은 곳을 검색해 가니, 2번째로 낮은 것은 시내의 양로원이었다.

평균 여생은 15년.

 


그리고 최하위는 예상대로 병원이었다.

무려 평균 여생이 4년이었다.

 


하지만 잠시 생각해보니 뭔가 이상했다.

아무리 아픈 사람이 잔뜩 모여있는 병원이라고는 해도, 평균치가 겨우 4년 밖에 안 나오는 것은 뭔가 이상하다.

가벼운 부상으로 잠시 입원한 사람도 있을테고, 단순한 감기로 진료만 받으러 온 사람도 있을텐데..

 


무슨 에러라도 난 게 아닌가 싶은 생각에, 나는 로그를 열어 하나씩 확인하기 시작했다.

그리고 그 충격적인 자료를 보고, 나도 모르게 소리를 지르고 말았다.

[ID : 1234 - VALUE : 34] 라는 서식으로 자료가 쭉 나와 있었다.

 


하지만 그 사이사이에, 34나 50 같은 평범한 수치에 섞여 결코 존재할 수 없는 값이 있었던 것이다.

여생 추정값이, 음수로 되어 있던 것이다.

 


혹시나 병원 쪽 자료만 잘못 된 것이 아닌가 싶어 다른 영상의 로그도 확인해 봤다.

음수로 뜬 값 자체는 모든 영상에서 2, 3개씩 발견되었지만, 병원 로그만큼 엄청난 숫자는 아니었다.

 


문자 그대로 해석하자면, [여생 마이너스 3년] 이라는 것은 곧 [죽은 뒤 3년 경과] 라는 것과 같은 의미다.

정상적인 양수값으로만 평균을 내면 병원의 여생 예상치는 전체 평균보다는 낮지만, 그래도 24년 정도의 수치가 나온다.

 


하지만 여생이 마이너스로 나온 자료가 극단적으로 많아서, 여생의 평균치가 4까지 떨어진 것이다.

애써 냉정함을 유지하려 노력했지만, 등 뒤로 식은 땀이 흐르는 것이 느껴졌다.

그 후 팀원들을 모아 자료를 놓고 논의를 계속 했지만, 기분 나쁜 결론만 도출될 뿐이었다.

 


결론은 크게 두 가지로 나뉘었다.

애초에 여생을 추측한다는 것 자체가 불가능한 일이라 오차 범위가 말도 안되게 커진 것 뿐이라는 것이 하나.

그리고 다른 하나는.. 우리 주변에 실제로 여생이 마이너스인 사람들이 태연하게 활보하고 있다는 것.

 


당연히 상식적으로는 첫번째 결론을 받아들일 수 밖에 없었다.

윗선에는 [얼굴 인식을 통한 건강 상태 예측] 을 하고 있었다고 대충 보고서를 쓴 뒤, 이 프로젝트는 그대로 폐기되었다.

다만 그 후, 내게 이 프로젝트를 결코 잊지 못하게 만든 사건이 일어났다.

 


시스템 테스트 도중 여생이 0년으로 나왔던 A가, 그 테스트를 하고 1년도 채 지나지 않아 정말로 세상을 떠났던 것이다.

아침 출근 시간에 지하철 플랫폼에서 몸을 던져 그대로 자살했다고 한다.

그 소식을 듣자 온 몸에 소름이 끼쳤다.

 


어떻게 컴퓨터는 그것을 예측할 수 있었던 것일까.

내 머리로는 도저히 이해가 되지 않는다.

컴퓨터에 입력된 정보는 샘플과 대상자의 얼굴 뿐이다.

 


하지만 사실로서 A는 세상을 떠났다.

컴퓨터가 내놓은 예상치와 정확히 일치하는 해에

나도 과학을 연구하고 있는 입장이고, 초자연적인 현상이나 비과학적인 것은 믿고 싶지 않다.

 


하지만 이 사건 이후, 나는 CCTV와 인파가 너무나도 무서워 견딜 수가 없다.

매일 수백, 수천의 사람들을 지나쳐 가며 시선이 마주치고, 엇갈려 간다.

그 사이에 이미 세상을 떠나고서도 몇 년이 훨씬 지난 얼굴을 한 사람이 없다고 단언할 수 있을까.

 


요즘 나는 병원 근처로 발도 들이지 않고 있다.

과연 앞으로 60년 뒤, 나는 세상을 떠나게 될 것인가.

그것만이 내게 남은 마지막 의문이다.

 


번역 : VKRKO

 

 

금산스님의 최근 게시물

무서운글터 인기 게시글