구본형 변화경영연구소

연구원

칼럼

연구원들이

  • 쭌영
  • 조회 수 2084
  • 댓글 수 1
  • 추천 수 0
2014년 2월 2일 23시 39분 등록

LA지역 풋힐 지역은 범죄율이 높은 지역이다. 마약 상인들이 버젓이 거리를 돌아다니며, 도난사건과 절도사건이 흔하게 일어나는 지역이다. 거리는 스산하고 높은 철조망은 음산함을 더한다.

순찰 중인 존은 풋힐 지역에서 잔뼈가 굵은 베테랑이다. 그는 범죄자들을 한눈에 알아볼 수 있는 눈과 그들의 심리를 꿰뚫는 노련함을 가지고 있다. 그는 업무에 대한 자부심이 대단하다. 하지만 요즘 그는 불만이다. 얼마전부터 본부에서 내려온 범죄 예방 프로그램에 따라서 정해준 지역을 순찰해야 하기 때문이다. 꼭 동물원의 원숭이가 된 것 같은 무력감을 느낀다.

컴퓨터가 범죄 지역을 예측하다니. 이게 말이나 되는 소리인가?’’ 존은 핸들을 붙잡으면서 불만을 터트린다. 상관이 범죄에 대한 직관과 자신의 경험을 믿지 못하는 것에 대해 서운함 마음도 들었다. 기계가 범죄를 예측한다니 퍽이나 우습다고 생각한다.

최근 LA지역은 범죄 예방프로그램을 시행하고 있다. 프로그램의 원리는 의외로 간단하다. 한 곳에서 범죄가 발생하면 그 주변 지역에 범죄가 발생할 확률이 높다는 점을 이용하여 간단한 알고리즘을 이용한 것이다. 컴퓨터는 매일매일 범죄가 발생활 확률이 높은 지역을 표시해주고, 경찰관들은 그 지역을 집중적으로 순찰하는 것이다.

이 프로그램은 캘리포니아 대학의 브랭틴험 교수와 산타클라라 대학의 몰러 교수가 만들었다. 그들의 핵심 알고리즘은 여진 예측 알고리즘을 도용하였다. 여진 예측 알고리즘은 간단하다. 대규모 지진을 예측하는 것은 힘들어도 여진은 예측이 가능하다는 사실을 이용하여, 지질 학자들이 여진 사이의 규칙을 발견하고 여진을 예측하는 공식이다.

두 교수는 그 공식을 그대로 이용하여 범죄 예측 알고리즘을 만들었다. 최초 범죄 발생지역은 찾기 어렵지만 그 주변에 범죄 발생 예측 지점은 어느 정도 예측 가능하다는 원리였다. 그리고 LA의 지난 1300만건의 범죄 기록들을 조회하여 공식에 적용해보니 발생했던 범죄들과 일치함을 발견했다. 그간 축척되었던 범죄들을 목록화하고 유형으로 나누어 더욱 정교하게 공식을 가다듬었다.

이 공식에 따라서 LA지역 범죄 지역과 범죄 시간을 예측할 수 있게 되었다. 1300만건의 범죄 기록을 흡수한 시스템은 정교한 계산을 한다. 그리고 마침내 이 시스템은 빛을 보기 시작했다. 실제 풋힐 지역은 절도 사건 12%, 강도 사건은 26%나 감소한다. 또한 새로운 데이터들이 업데이트 되면서 범죄 예보 시스템은 더욱 정교해지기 시작했다.

존은 이러한 사실 때문에 불만을 가지면서도 수긍할 수 밖에 없었다. 실제로 시스템이 알려준 범죄 지역을 순찰하기 시작하면서 확실히 범죄율이 낮아짐을 피부로 느끼게 된 것이다. 존은 십년간의 자신의 경험보다 컴퓨터가 더 정확하다는 사실이 놀라우면서도 씁쓸했다.

 

데이터 마이닝(Data Mining)이 더욱더 중요해지는 사회가 되어 가고 있다. 데이터는 범죄 예측에서만 사용하는 것이 아니다. 인간들의 다양한 행동양식과 의료, 우주, 스포츠, 광고, 그 밖의 다양한 영역으로 적용이 가능하다. 그 활용방법은 예측 불가능 할 정도로 다양하다.

그리고 이런 방대한 데이터를 일종의 금광이라고 생각하고 수집하는 학문. 그것이 바로 데이터 마이닝이다. 무수한 데이터를 분석하고 규칙을 찾다보면 사람들이 알지 못하는 새로운 의미들을 발견할 수 있다. 데이터 마이닝은 우리가 의미없다고 생각하는 데이터들에서 새로운 법칙, 아젠다, 주제들을 찾아내는 것이다.

정보의 홍수속에 살고 있는 요즘, 하루에도 엄청난 양의 데이터가 쏟아져 나오고 있다. 이러한 데이터는 알게 모르게 조금씩 인류의 삶을 바꾸어 가고 있다. 미래는 데이터를 만들고 가공하는 것에 대한 싸움이다. 인간은 자율적인 것 같지만 행동이 규칙적이고 정형화되어 있다. 이런 사실을 인지하고 데이터를 잘 활용한다면 미래는 풍요롭게 발전할 수 있다.

아차, 노파심에서 하는 얘기지만 너무 데이터에 의존해서 사는 것도 능사는 아니다. 정없고 딱딱한 사회는 그 누구도 원하지 않을 것이다. 데이터를 활용하고 분석하는 것과 함께 데이터를 어떻게 인간적으로 사용할지에 대한 질문도 계속 해나가야 한다. 인문학이 더욱 중요해지는 시대가 올 것이다.

IP *.209.96.61

프로필 이미지
2014.02.04 05:44:25 *.65.153.75
- 준비된 글감을 능숙하게 이용하는 것 같다. ^^
- 마지막 문단은 내 고민이기도 한데 ...
뭐랄까... 확률이 높은 거랑 범죄발생은 한 개인의 차원으로 보는 차원의 문제라고 해야하나... 거시적 관리 차원에서 한 명 한 명 "인간"이라는 미시적 관점으로 촛점을 맞추어 내고, 다시 한 명 한 명 "인간"에게서 거시적 우주를 발견해내는 역할이 인문학의 영역인 것 같아. ... (나도 헤매고 있다)
- 어쨋거나 난 댓글 1등!!^♥^
덧글 입력박스
유동형 덧글모듈

VR Left
번호 제목 글쓴이 날짜 조회 수
3892 시인의 세계를 엿보았습니다 유형선 2014.02.04 1921
3891 2-41. 너의 태명 콩두 2014.02.04 3303
» #35. 데이터의 잠재력 [1] 쭌영 2014.02.02 2084
3889 2-40. 결혼의 여신 헤라 콩두 2014.01.29 4026
3888 [1월 오프수업] 10개월 연구원 수업 돌아보기 file 라비나비 2014.01.28 1903
3887 No 39.10개월 수행과제 총평 및 니체와 러셀이 보낸 러브레터 미스테리 2014.01.28 1961
3886 2-39. 남편에게 복수하기 위해 자식을 죽인 여자 콩두 2014.01.28 3716
3885 러셀이 보내는 편지 (1월과제) 제이와이 2014.01.28 2147
3884 #33. (1월 오프수업) 쏜살같은 1년 그리고 우공이산 땟쑤나무 2014.01.28 1925
3883 MeStory(3) : 호주머니 속 물건들이 나를 말해준다 file 타오 한정화 2014.01.27 2613
3882 [No.9-5] 장자로부터 온 편지 및 수행과제 총평(수업발표) - 서은경 서은경 2014.01.26 1943
3881 #34. 나는 누구인가(1월 오프수업) 쭌영 2014.01.25 2018
3880 장자가 내게 준 편지 _ 1월 수업 과제물 유형선 2014.01.25 2231
3879 2-38. 나도 마흔 세 살에 다시 시작하고 싶다 [6] 콩두 2014.01.21 3689
3878 안전속도를 유지하자 [1] 라비나비 2014.01.21 1954
3877 눈을 기다립니다 [4] 유형선 2014.01.20 1934
3876 [No.9-4] 어쩌면 쓰다 - 서은경 file [7] 서은경 2014.01.20 1955
3875 사람을 찾습니다 [1] 제이와이 2014.01.20 1945
3874 No 38 덜어내기 [6] 미스테리 2014.01.20 2069
3873 키드니 7 레몬 2014.01.19 2355