posted by e비즈북스 2012.04.27 13:38

빅데이터는 2012년 가장 hot한 IT트렌드라고 할 주제죠. 그에 맞춰 <이제는 빅데이터 시대>를 출간했습니다.




원고를 검토하면서 과연 빅데이터란 무엇인가에 대해 진지하게 고민을 했습니다. 자신의 위치가 어디에 있느냐에 따라 빅데이터를 보는 시각이 다릅니다. 그래서 일부에서는 빅데이터의 개념부터 정의해야 한다고 하기도 합니다. 그래야 이야기가 가능하다나요?  저처럼 IT비즈니스를 담당하는 출판인은 어디에 있어야 할까요?

보통 빅데이터를 소개할때  3V라해서 다양한Variety’, ‘다량의Volume’ 정보가 ‘실시간에 가까운 속도Velocity’를 이야기합니다. 빅데이터가 대두된 원인으로 스마트폰과 SNS로 발생하는 데이터 폭주와 소셜분석을 이야기하죠. 그 적용사례로 선거결과 예측은 빠지지 않고 등장하고, 빅데이터를 분석하는 플랫폼으로 하둡이 언급됩니다. 그내용을 잘 모르는 일반인이 보기엔 어려운 내용들이죠.

하지만 저는 빅데이터를 굳이 그렇게 딱딱하게 최신 기술의 시각으로 접근할 필요는 없다고 생각합니다. 이 부분에서 저자이신 윤형중 기자님께 감사드립니다. 저 역시 처음에 기획할때는 기술쪽에 촛점을 맞췄었는데 원고를 읽다보니 빅데이터란게 하늘에서 떨어진 개념은 아닐 수 있다는 생각이 들었습니다. 디지털은 애초부터 빅데이터와 뗄레야 뗄수 없는 관계입니다. 빅데이터는 이미 곳곳에서 활용되고 있습니다. 빠르고 효과적인 분석기술의 발전은 언젠가 벌어질 일이지만 과거부터 데이터는 쌓여가고 있었습니다.

본의 아니게 공공재가 된 개인 신상정보를 예로 들겠습니다. 범죄조직은 이 신상정보로 회원가입을 하기도 하고, 보이스 피싱에 활용하기도 합니다. 빅데이터를 싸게 얻을 수 있고, 전화비도 저렴하기 때문에 가능한 일이죠. 요즘에는 보이스 피싱 방법도 나날이 발전하고 있습니다-- 범죄조직으로선 새로운 가치창출입니다. 그보다 양지의 영역에서는 스팸메시지를 날려주기도 합니다. 이쪽은 보이스피싱보다는 발전속도가 좀 더딘것 같습니다. 아무래도 보이스피싱이 성공시 수익이 훨씬 높다보니 범죄조직이 더 심혈을 기울이는 것 같습니다^^

NASA는 보유하고 있는 수십만장의 화성사진을 일반인에게 공개했습니다. 소수의 과학자들로는 이 사진들을 분석할 여력이 없으니 일반인에게 공개해서 의미있는 무엇인가를 찾아보자는 취지입니다. 가끔 화성에서 문명의 흔적을 발견했다는 기사가 뜨는데 아마추어 분석가들의 작품이죠. 값비싼 고급인력보다는 일반인이 찾아주는 것이 비용 대비효과가 뛰어납니다. 일종의 아웃소싱이라고 할 수 있겠죠^^하지만 일반인들도 취미를 살릴 수 있으니 윈윈게임입니다. 컴퓨터의 분석능력이 획기적으로 개선되지 않는 한 이 방법보다 더 나은 방법이 생각나지 않는군요. 이 책에 나온 IBM의 인공지능 컴퓨터 왓슨을 동원하면 되려나요? 그런데 홍보효과가 없어서 IBM이 하려나 모르겠습니다. 왓슨이 외계문명 흔적을 발견했다면 이슈가 되겠지만 아무것도 발견하지 못했다면 헛수고잖아요?

독재 권력이라면 빅데이터 기술로 국민을 감시할 수 있는 빅브라더가 충분히 가능합니다. 미국의 글로벌 도청 시스템인 에셜론은 빅데이터 분석 기술이 나오기도 전에 활약을 했습니다. 전화로 수다를 떨다 'bomb'을 언급한 주부를 몇 년 동안 관찰 대상으로 올려놓았다고도 하죠. e메일 계정부터 인터넷 접속 기록까지 디지털 세계에서 하는 모든 행동은 감시할 수 있습니다. 그래서 선진국에서는 개인 사생활 보호를 위해 안전장치를 마련하려고 분주합니다. 소위 말하는 지워질 권리를 찾기 위함입니다. 하지만 기술이 발전함에 따라 개인 사생활 정보의 노출은 돌이킬 수 없는 추세입니다. 페이스북이 기업 공개를 하기도 전에 1000억불이 넘는 가치를 인정받는 것은 바로 사용자가 남긴 정보가 그만큼의 가치가 있기 때문입니다.

이런 흐름에서 개인 정보 보호에만 촛점을 맞추는 것은 미봉책이라고 생각합니다. 차라리 개인들도 정부나 기업들이 가진 데이터에 접근하는 것으로 견제하는 것이 낫지 않을까 싶습니다. 정보가 돈이 되는 한 수집하는 쪽은 어떻게 해서든 방법을 찾으려 할 것이기 때문입니다. 제가 아는 분에게 세무 기장쪽의 사업 추진 방향을 한 번 들어본 적이 있는데 듣자마자 대박 아이템이라는 감이 오더군요. 저는 실패 가능성부터 보는 스타일입니다^^ 그런데 국세청이 마음을 먹는다면? 사업자들에게는 악몽이 되는거죠-- 그런데 반대로 사업자가 이 데이터에 접근할 수 있으면 자신의 사업에 활용 할 수 있습니다. 세무서 직원보다는 사업자들이 그 내용을 잘 알기 때문에 데이터가 더 유용한 거죠.

저는 기획을 하기 전에 꼭 네이버 키워드 광고 서비스를 이용합니다. 해당 주제의 키워드 검색 횟수를 보고 승산이 어느 정도될까 판단을 내리는데 유용합니다. 아쉬운 것은 판매금지 키워드는 조회수를 확인할 수 없다는 점이죠. 그럴때는 다른 키워드 광고 서비스를 이용합니다. 그냥 참고만 하는편이지만 없는 것보다는 낫습니다.

어쨌든 빅데이터 시대는 피할 수 없습니다. 거의 모든 디지털 데이터가 기록으로 남는 세상입니다. 인류 문명이 생기고 나서 2003년까지 축적된 데이터가 5엑사바이트라고 합니다. 그런데 2010년에 생성된 데이터만 1.2제타바이트로 200배가 넘습니다. 놀랍지 않은가요?  이런 시대를 어떻게 살아가야 할까요? 책에서는 서울버스 앱에서 그 실마리를 찾습니다. 경기도에서 법규정을 이유로 서울버스 앱의 접근을 막았지만 여론의 압력에 굴복해서 제한을 풀어야 했죠. 정부가 가진 데이터를 공유해서 활용을 하면 시민의 편익을 향상시킬 수 있는 부분이 많이 있습니다. 그리고 국가 경쟁력 향상에도 무척 도움이 될 수 있구요. 공무원보다는 돈에 민감한 기업들이 머리를 많이 쓰기 마련입니다. 정부,시민,기업 모두가 윈윈하는 빅데이터의 시대가 오길 바랍니다. 

책소개 페이지

예스24

인터파크


댓글을 달아 주세요

  1. 취비(翠琵) 2012.04.27 20:38 신고  Addr  Edit/Del  Reply

    아~ 네이버 판매금지 키워드는 혹시 어떤걸로 조사해보시나요?
    저도 네이버에서 주로 키워드를 검색하는데 판매금지 키워드의 경우 남감하더군요...ㅠㅠ

    • e비즈북스 2012.04.28 09:15  Addr  Edit/Del

      다음 키워드 광고입니다. 구글애드워즈는 거의 사용하지않습니다. 다음의 경우 트렌드챠트도 사용합니다.