posted by e비즈북스 2012.05.08 13:54



빅 데이터로부터 개인을 보호하기 위해 가장 중요한 것이 바로 ‘익명화’다. 이는 빅 데이터에서 특정 개인을 식별하지 못하도록 정보를 가공하는 작업이다. 예를 들어 유통 업체의 판매기록과 카드 업체의 결제기록 등의 데이터를 활용해 물가를 파악할 수 있는 시스템을 만든다면 이들 정보에서 특정 개인이 무엇을 구매했는지 등의 데이터가 추출되지 않도록 하는 작업이다. 마찬가지로 개인의 위치정보를 수집하는 업체가 향후에 이 데이터를 공유하는 플랫폼을 만든다면 ‘개인이 언제 어디에 있었다’는 정보가 추출되지 않도록 하는 것도 익명화다. 현재 서비스 중인 구글어스나 다음 로드뷰 등에서 개인의 얼굴에 모자이크 처리를 한 것이 익명화가 이미 이뤄진 사례다. 반면 웹상에서 구글링을 통해 수집할 수 있는 개인정보는 아직 익명화가 제대로 되지 않은 정보들이다. 요즘은 구글링을 통해 개인의 신상을 털거나 심지어 배우자의 외도를 파악하기도 한다.

보통 익명화가 문제가 되는 건 데이터가 대중에 공개됐을 경우다. 아직까지 기업 내부에 쌓이는 정보에 대해서는 익명화를 요구하진 않고 있다. 오히려 빅 데이터가 공개되지 않을 경우엔 개인에 대한 식별이 가능해야만 경제적 가치가 커진다. 예를 들어 넷플릭스가 영화를 추천하는 시네매치나 페이스북과 구글이 개인의 취향에 맞는 광고를 노출시키는 것도 개인을 식별할 수 있기 때문이다. 오히려 식별 가능한 개인의 기록을 더 많이 확보하는 것이 기업의 전략이 되고 있다. 구글은 자사의 서비스들에서 수집되는 개인정보를 통합 관리하고 로그인하는 채널을 일원화하겠다고 사용자들에게 일방적으로 발표해 전 세계에서 논란이 됐다. 하지만 이런 구글의 방침은 국내법 위반의 소지가 있다. 정보통신망법 22조에 따라 구글이 개인정보의 이용목적을 구체적으로 제시하지 않았고 개인정보의 보유 이용기간 등도 명시하지 않았을 뿐 아니라 명시적 동의절차가 제대로 갖춰져 있지 않았다는 것이다. 구글은 당초 새 개인정보 관리방침이 한국의 법을 준수하고 있다고 주장했지만 결국 정부의 지적을 받아들여 개인정보 관리방침을 수정했다.

하지만 이번 조치로 구글은 개인에 대해 더 많은 정보를 수집할 가능성이 높아졌다. 특히 구글 서비스에 대한 로그인 통합으로 인해 자신도 모르는 상태에서 로그인을 하고서 서비스들을 사용하기 쉽다. 예를 들어 G메일을 사용하기 위해 로그인을 하고서 창을 닫지 않고 유튜브를 이용하면 자신이 어떤 동영상을 봤는지 등이 구글 서버에 기록된다. 검색창에 입력하는 검색어도 마찬가지다. 이에 대해 구글측은 “로그인을 하지 않아도 기존대로 구글의 검색, 유튜브 서비스를 이용할 수 있고 자신의 검색 기록 등을 삭제할 수 있기 때문에 오히려 자기정보에 대한 통제력이 더 강해진다”고 주장한다.

애플은 아이클라우드를 통해 개인에게 데이터 저장공간을 제공하면서 특정인이 소유한 데이터에 대한 정보도 확보하고 있다. 이처럼 구글, 애플, 페이스북 등 플랫폼 사업자들은 민간인 사찰마저 가능할 정도로 식별 가능한 개개인의 엄청난 정보를 수집하고 있다. 페이스북은 2011년 말 미국연방거래위원회의 권고로 개인정보 보호 개선안을 받아들였다. 이로 인해 개인정보를 광고주와 공유할 때 미리 밝히고 앞으로 20년간 독립적인 감시기구로부터 개인정보 보호에 대한 평가를 받기로 했다. 미 의회에서도 꾸준히 페이스북의 개인정보 관리 실태를 모니터링하고 있고 견제와 감시를 하고 있다. 이처럼 개인에 대한 정보를 축적하는 주체가 정부가 아니라 기업으로 바뀌고 있기 때문에 기업 내에 쌓이는 정보에서 어떻게 개인을 보호할지도 향후 중요한 화두로 부상할 것이다.



<이제는 빅 데이터 시대>.2012년 4월 출간.윤형중著.e비즈북스.


댓글을 달아 주세요