'개인정보'에 해당되는 글 2건

  1. 2012.05.08 누군가 당신을 지켜보고 있다
  2. 2012.05.02 빅 데이터, 왜 떴을까
posted by e비즈북스 2012.05.08 13:54



빅 데이터로부터 개인을 보호하기 위해 가장 중요한 것이 바로 ‘익명화’다. 이는 빅 데이터에서 특정 개인을 식별하지 못하도록 정보를 가공하는 작업이다. 예를 들어 유통 업체의 판매기록과 카드 업체의 결제기록 등의 데이터를 활용해 물가를 파악할 수 있는 시스템을 만든다면 이들 정보에서 특정 개인이 무엇을 구매했는지 등의 데이터가 추출되지 않도록 하는 작업이다. 마찬가지로 개인의 위치정보를 수집하는 업체가 향후에 이 데이터를 공유하는 플랫폼을 만든다면 ‘개인이 언제 어디에 있었다’는 정보가 추출되지 않도록 하는 것도 익명화다. 현재 서비스 중인 구글어스나 다음 로드뷰 등에서 개인의 얼굴에 모자이크 처리를 한 것이 익명화가 이미 이뤄진 사례다. 반면 웹상에서 구글링을 통해 수집할 수 있는 개인정보는 아직 익명화가 제대로 되지 않은 정보들이다. 요즘은 구글링을 통해 개인의 신상을 털거나 심지어 배우자의 외도를 파악하기도 한다.

보통 익명화가 문제가 되는 건 데이터가 대중에 공개됐을 경우다. 아직까지 기업 내부에 쌓이는 정보에 대해서는 익명화를 요구하진 않고 있다. 오히려 빅 데이터가 공개되지 않을 경우엔 개인에 대한 식별이 가능해야만 경제적 가치가 커진다. 예를 들어 넷플릭스가 영화를 추천하는 시네매치나 페이스북과 구글이 개인의 취향에 맞는 광고를 노출시키는 것도 개인을 식별할 수 있기 때문이다. 오히려 식별 가능한 개인의 기록을 더 많이 확보하는 것이 기업의 전략이 되고 있다. 구글은 자사의 서비스들에서 수집되는 개인정보를 통합 관리하고 로그인하는 채널을 일원화하겠다고 사용자들에게 일방적으로 발표해 전 세계에서 논란이 됐다. 하지만 이런 구글의 방침은 국내법 위반의 소지가 있다. 정보통신망법 22조에 따라 구글이 개인정보의 이용목적을 구체적으로 제시하지 않았고 개인정보의 보유 이용기간 등도 명시하지 않았을 뿐 아니라 명시적 동의절차가 제대로 갖춰져 있지 않았다는 것이다. 구글은 당초 새 개인정보 관리방침이 한국의 법을 준수하고 있다고 주장했지만 결국 정부의 지적을 받아들여 개인정보 관리방침을 수정했다.

하지만 이번 조치로 구글은 개인에 대해 더 많은 정보를 수집할 가능성이 높아졌다. 특히 구글 서비스에 대한 로그인 통합으로 인해 자신도 모르는 상태에서 로그인을 하고서 서비스들을 사용하기 쉽다. 예를 들어 G메일을 사용하기 위해 로그인을 하고서 창을 닫지 않고 유튜브를 이용하면 자신이 어떤 동영상을 봤는지 등이 구글 서버에 기록된다. 검색창에 입력하는 검색어도 마찬가지다. 이에 대해 구글측은 “로그인을 하지 않아도 기존대로 구글의 검색, 유튜브 서비스를 이용할 수 있고 자신의 검색 기록 등을 삭제할 수 있기 때문에 오히려 자기정보에 대한 통제력이 더 강해진다”고 주장한다.

애플은 아이클라우드를 통해 개인에게 데이터 저장공간을 제공하면서 특정인이 소유한 데이터에 대한 정보도 확보하고 있다. 이처럼 구글, 애플, 페이스북 등 플랫폼 사업자들은 민간인 사찰마저 가능할 정도로 식별 가능한 개개인의 엄청난 정보를 수집하고 있다. 페이스북은 2011년 말 미국연방거래위원회의 권고로 개인정보 보호 개선안을 받아들였다. 이로 인해 개인정보를 광고주와 공유할 때 미리 밝히고 앞으로 20년간 독립적인 감시기구로부터 개인정보 보호에 대한 평가를 받기로 했다. 미 의회에서도 꾸준히 페이스북의 개인정보 관리 실태를 모니터링하고 있고 견제와 감시를 하고 있다. 이처럼 개인에 대한 정보를 축적하는 주체가 정부가 아니라 기업으로 바뀌고 있기 때문에 기업 내에 쌓이는 정보에서 어떻게 개인을 보호할지도 향후 중요한 화두로 부상할 것이다.



<이제는 빅 데이터 시대>.2012년 4월 출간.윤형중著.e비즈북스.


댓글을 달아 주세요

posted by e비즈북스 2012.05.02 11:59


빅 데이터, 왜 떴을까

빅 데이터는 말 그대로 엄청나게 큰 데이터를 의미한다. 과거와는 차원이 다른 양의 데이터를 지칭하고, 최근엔 양적인 의미를 벗어나 대규모 데이터의 분석과 활용을 포괄하는 용어로도 사용된다.

데이터가 갑자기 폭증하게 된 주된 원인으로 스마트폰이 가장 먼저 꼽힌다. 스마트폰을 통해 언제 어디서나 온라인 접속이 가능해지면서 사용자의 위치정보, 온라인 사용기록 등이 어딘가에 저장되기 시작했다. 특히 스마트폰이 불을 지핀 소셜 네트워크 서비스SNS는 사용자들의 일상생활, 생활의 단상, 의견, 취향 등 깨알 같은 기록을 온라인에 남겼다. 자신의 기록을 남길 뿐 아니라 콘텐츠를 소비하는 주된 플랫폼으로도 활용된다. 이미 많은 사람들이 SNS를 통해 지인들의 소식과 뉴스, 음악, 동영상 등의 콘텐츠를 소비한다.

페이스북 가입자는 빠르게 늘면서 이미 8억 명을 돌파했고, 2012년엔 10억 명 돌파가 확실시되고 있다. 이 사람들이 하루에 하나씩만 메시지를 남겨도 하루 10억여 건의 메시지가 생성된다. 3000만 명의 가입자를 확보한 카카오톡에서 하루 동안 전송되는 메시지도 10억 건을 넘어섰다. SNS는 점차 메시지 전달에서 콘텐츠를 소비하는 플랫폼으로 발전하고 있기 때문에 축적되는 데이터양은 더욱 커질 전망이다.

SNS 외에 스마트폰으로 인터넷에 접속해 검색하는 내용도 어딘가에 기록된다. 구글, 네이버 등의 검색엔진에 특정 키워드를 입력한 횟수 등은 해당 업체의 서버에 저장된다. 스마트폰에 탑재된 GPS칩, NFC칩 등은 위치정보와 구매정보 등을 기록한다. 이젠 사용자의 허락만 받는다면 어디를 자주 돌아다니고 어떤 상품을 구매하는지도 알 수 있다. 이렇듯 스마트폰과 SNS는 이전에 수집되지 않던 엄청난 양의 정보를 모으는 도구가 됐다. 이는 빅 데이터라는 키워드가 부상하게 된 가장 중요한 요인이다.

스마트폰, SNS의 대중화 외에 데이터가 폭증하는 이유는 또 있다. 바로 모든 영역의 전산화가 가속화되고 있기 때문이다. 기업과 공공기관, 비정부기구 등 조직이 있는 모든 곳에서 전산시스템의 도입은 필수가 되고 있다. 하다못해 컴퓨터 한 대는 있어야 일을 할 수 있다. 특히 기업에서 재고와 공급망 관리 혹은 생산비용을 줄이기 위해 업종을 막론하고 전산장비를 적극적으로 도입했다. 오늘날 은행의 전산망이 마비된다면 예금, 대출 등 모든 업무가 마비될 정도로 크게 의존하고 있다. 패션 업체 자라는 판매처의 수요를 즉각적으로 파악해 재고관리, 생산주문에 활용한 결과 세계적인 업체로 성장했다. 심지어는 야구와 같은 스포츠에서도 기록과 팀 전력을 데이터로 만들어 관리하는 기법이 인기를 얻고 있다. 모든 업무가 전산화되는 트렌드는 정부도 예외는 아니다. 정부의 공공서비스는 물론 공공정보 역시 전산화된 시스템으로 수집, 관리되고 있다.

용량이 큰 멀티미디어 콘텐츠의 증가도 데이터가 늘어나는 원인이다. 구글의 유튜브에 업로드 되는 동영상은 2007년 1분에 6시간 분량이었지만, 2010년엔 1분에 24시간 분량이 됐다. 2012년 초에는 1분당 60시간 분량의 동영상이 업로드 되는 등 멀티미디어 콘텐츠가 폭증하고 있다. 향후 LTE 등 4세대 통신망이 대중화되면 동영상 서비스가 빠른 속도로 활성화될 것이라고 전망된다. 이렇게 되면 멀티미디어 콘텐츠의 양도 훨씬 늘어나게 된다.

빅 데이터가 부상하는 마지막 배경은 기기 간에 정보를 주고받는 사물지능통신M2M 센서의 증가다. CCTV, 기상관측기, 오염측정기 등 이미 전 세계에서 사용되는 M2M 센서만 3000만 개에 달한다. 고속도로 CCTV는 교통량을 측정하고, 인공위성의 관측 장비는 기상을 예측하는 용도로 활용된다. 향후 M2M 센서는 의료기기를 비롯해 가축, 차량 등에 부착·탑재될 예정이기 때문에 그 수가 폭발적으로 늘어날 전망이다. 빅 데이터의 특성은 스티브 밀스 IBM 총괄사장이 명쾌하게 설명했다. 그는 빅 데이터의 특성을 ‘3V’로 요약했다. ‘다양한Variety’ ‘다량의Volume’ 정보가 ‘실시간에 가까운 속도Velocity’로 흘러들어 온다는 의미다.

빅 데이터를 세는 단위도 이전과 다르다. 과거 데이터가 많다고 하면 기가바이트GB의 1000배인 테라바이트TB를 연상하는 것이 보통이었다. 하지만 최근에는 테라바이트를 넘어 페타Peta, 엑사Exa, 제타Zetta바이트까지 등장하고 있다. 제타바이트는 기가바이트보다 1조 배 큰 단위다. 2003년까지 생산된 정보가 5엑사바이트에 달하는데 반해 2010년에만 1.2제타바이트의 정보가 생산된 것으로 추정된다. 2020년에는 연간 생성되는 데이터가 35제타바이트로 늘어날 전망이다.



<이제는 빅 데이터 시대>.2012년 4월 출간.윤형중著.e비즈북스.


댓글을 달아 주세요