'it100시리즈/이제는 빅 데이터 시대'에 해당되는 글 6건

  1. 2012.05.08 누군가 당신을 지켜보고 있다
  2. 2012.05.07 클라우드 업체
  3. 2012.05.04 서울버스 사건이 알려준 정부2.0 (2)
  4. 2012.05.03 머니볼이 알려준 의사결정의 비밀 (2)
  5. 2012.05.02 빅 데이터, 왜 떴을까
  6. 2012.04.30 빅 데이터가 여는 미래 (2)
posted by e비즈북스 2012.05.08 13:54



빅 데이터로부터 개인을 보호하기 위해 가장 중요한 것이 바로 ‘익명화’다. 이는 빅 데이터에서 특정 개인을 식별하지 못하도록 정보를 가공하는 작업이다. 예를 들어 유통 업체의 판매기록과 카드 업체의 결제기록 등의 데이터를 활용해 물가를 파악할 수 있는 시스템을 만든다면 이들 정보에서 특정 개인이 무엇을 구매했는지 등의 데이터가 추출되지 않도록 하는 작업이다. 마찬가지로 개인의 위치정보를 수집하는 업체가 향후에 이 데이터를 공유하는 플랫폼을 만든다면 ‘개인이 언제 어디에 있었다’는 정보가 추출되지 않도록 하는 것도 익명화다. 현재 서비스 중인 구글어스나 다음 로드뷰 등에서 개인의 얼굴에 모자이크 처리를 한 것이 익명화가 이미 이뤄진 사례다. 반면 웹상에서 구글링을 통해 수집할 수 있는 개인정보는 아직 익명화가 제대로 되지 않은 정보들이다. 요즘은 구글링을 통해 개인의 신상을 털거나 심지어 배우자의 외도를 파악하기도 한다.

보통 익명화가 문제가 되는 건 데이터가 대중에 공개됐을 경우다. 아직까지 기업 내부에 쌓이는 정보에 대해서는 익명화를 요구하진 않고 있다. 오히려 빅 데이터가 공개되지 않을 경우엔 개인에 대한 식별이 가능해야만 경제적 가치가 커진다. 예를 들어 넷플릭스가 영화를 추천하는 시네매치나 페이스북과 구글이 개인의 취향에 맞는 광고를 노출시키는 것도 개인을 식별할 수 있기 때문이다. 오히려 식별 가능한 개인의 기록을 더 많이 확보하는 것이 기업의 전략이 되고 있다. 구글은 자사의 서비스들에서 수집되는 개인정보를 통합 관리하고 로그인하는 채널을 일원화하겠다고 사용자들에게 일방적으로 발표해 전 세계에서 논란이 됐다. 하지만 이런 구글의 방침은 국내법 위반의 소지가 있다. 정보통신망법 22조에 따라 구글이 개인정보의 이용목적을 구체적으로 제시하지 않았고 개인정보의 보유 이용기간 등도 명시하지 않았을 뿐 아니라 명시적 동의절차가 제대로 갖춰져 있지 않았다는 것이다. 구글은 당초 새 개인정보 관리방침이 한국의 법을 준수하고 있다고 주장했지만 결국 정부의 지적을 받아들여 개인정보 관리방침을 수정했다.

하지만 이번 조치로 구글은 개인에 대해 더 많은 정보를 수집할 가능성이 높아졌다. 특히 구글 서비스에 대한 로그인 통합으로 인해 자신도 모르는 상태에서 로그인을 하고서 서비스들을 사용하기 쉽다. 예를 들어 G메일을 사용하기 위해 로그인을 하고서 창을 닫지 않고 유튜브를 이용하면 자신이 어떤 동영상을 봤는지 등이 구글 서버에 기록된다. 검색창에 입력하는 검색어도 마찬가지다. 이에 대해 구글측은 “로그인을 하지 않아도 기존대로 구글의 검색, 유튜브 서비스를 이용할 수 있고 자신의 검색 기록 등을 삭제할 수 있기 때문에 오히려 자기정보에 대한 통제력이 더 강해진다”고 주장한다.

애플은 아이클라우드를 통해 개인에게 데이터 저장공간을 제공하면서 특정인이 소유한 데이터에 대한 정보도 확보하고 있다. 이처럼 구글, 애플, 페이스북 등 플랫폼 사업자들은 민간인 사찰마저 가능할 정도로 식별 가능한 개개인의 엄청난 정보를 수집하고 있다. 페이스북은 2011년 말 미국연방거래위원회의 권고로 개인정보 보호 개선안을 받아들였다. 이로 인해 개인정보를 광고주와 공유할 때 미리 밝히고 앞으로 20년간 독립적인 감시기구로부터 개인정보 보호에 대한 평가를 받기로 했다. 미 의회에서도 꾸준히 페이스북의 개인정보 관리 실태를 모니터링하고 있고 견제와 감시를 하고 있다. 이처럼 개인에 대한 정보를 축적하는 주체가 정부가 아니라 기업으로 바뀌고 있기 때문에 기업 내에 쌓이는 정보에서 어떻게 개인을 보호할지도 향후 중요한 화두로 부상할 것이다.



<이제는 빅 데이터 시대>.2012년 4월 출간.윤형중著.e비즈북스.


신고
크리에이티브 커먼즈 라이선스
Creative Commons License
posted by e비즈북스 2012.05.07 10:41


빅 데이터의 화두를 가장 먼저 꺼낸 업체들은 IBM, HP, 오라클, EMC, MS, SAP, SAS 등 기업용 서버 컴퓨터와 솔루션을 제공하던 업체들이다. 이 업체들의 사업모델 자체가 기업들이 가진 데이터를 관리, 분석하는 컴퓨터와 소프트웨어를 판매하는 것이기 때문에 사업적인 목적을 위해서 클라우드, 빅 데이터 등의 트렌드를 이끌어왔다. 빅 데이터 시대가 오면 가장 먼저 수혜를 받을 것으로 기대되고, 그만큼 경쟁도 치열해지고 있다.

잠시 클라우드와 빅 데이터에 대해 설명하자면 클라우드란 네트워크상에 프로그램과 데이터를 저장하고 언제 어디서나 접속해 사용할 수 있는 서비스를 가리킨다. 기업 입장에서는 자사의 컴퓨팅 자원(서버, 스토리지, 미들웨어) 등을 자체 데이터센터와 외부 전문 업체에 분산해서 필요한 양만큼 사용하는 서비스다. 개인 입장에서는 전문 클라우드 업체에 데이터를 저장하고 언제 어디서나 컴퓨터, 스마트폰, 태블릿PC 등으로 접속해 사용할 수 있는 서비스가 클라우드다. 구름과 같은 무형의 형태로 존재하기 때문에 클라우드라고 불린다. 사실 클라우드가 등장한 배경에는 데이터의 폭증이 자리잡고 있다. 많아진 데이터를 네트워크 기술을 통해 분산, 저장해 가장 효율적으로 관리하려는 서비스가 바로 클라우드다. 따라서 기업용 솔루션을 제공하던 업체들이 과거엔 클라우드를 선도적으로 제시하고 2011년부턴 빅 데이터를 화두로 내세운 것은 어찌 보면 너무나 당연한 일이다.

클라우드 업체 중 가장 먼저 눈여겨볼 업체는 IBM이다. 설립된 지 100년이 넘은 오래된 기업 IBM은 누구보다 빠르게 변신하는 기업이기도 하다. 개인용 컴퓨터 시대를 연 주역이면서 2005년엔 PC사업부를 레노보에 매각했고 기업용 솔루션 분야에만 집중했다. 그 이후 클라우드 컴퓨팅과 빅 데이터라는 이슈도 선도적으로 제시했고 그냥 제시하는 것이 아니라 막대한 투자를 단행하며 인수합병에 나섰다. 2010년 10월 데이터 분석기술에 특화된 네티자를 17억 달러에 인수한 것을 비롯해 5년 동안 140억 달러 이상을 투자해 데이터 분석과 관련된 업체 24개 업체를 인수했다.

IBM은 기업에 데이터 분석제품을 판매할 뿐 아니라 직접 데이터 분석을 통해 새로운 가치를 창출하는 모델을 제시해 왔다. 2008년부터 추진한 ‘스마터 플래닛’ 전략이 대표적이다. 이는 IT 기술을 금융, 유통, 통신, 물류, 보건, 에너지, 환경 등 다양한 분야에 적용해 낭비와 비효율적인 요소를 줄이자는 전략이다. 이처럼 각 분야에 IT 기술이 접목되면 데이터가 생성되고 이를 관리하고 분석하는 기술이 중요해진다. 즉 스마터 플래닛의 핵심이 빅 데이터인 셈이다. 물 사업에 뛰어든 것도 빅 데이터와 밀접한 관련이 있다. IBM은 2009년 센서를 활용해 수도파이프, 저수조, 강, 항만시설을 모니터링하는 시스템을 개발했다. 예를 들어 홍콩에 새로 건설된 다리에는 1000개의 센서가 부착되어 있다. 이 센서에서 수질과 수량 등의 데이터들이 실시간으로 수집된다.



인기 퀴즈쇼 제퍼디!에서 우승을 차지한 IBM의 인공지능 컴퓨터 왓슨
(http://www.flickr.com/photos/pahudson/5414428698)



화제를 모으고 있는 인공지능 컴퓨터 왓슨도 빅 데이터 기술을 적용한 사례다. IBM이 개발한 왓슨은 2011년 2월 미국의 인기 퀴즈쇼 <제퍼디!>에 출연해 퀴즈 달인들을 물리치고 우승을 차지해 유명해졌다. 왓슨은 3초에 약 2억 장 분량의 자료를 읽고 이해할 수 있는데 이미 2011년 9월부터 미국의 의료보험 업체인 웰포인트에 도입돼 수백만 건의 의료특허 문헌을 분석하는 데 활용됐다. 2012년부터 왓슨은 월가에도 고용됐다는 보도가 나왔다. 왓슨이 씨티은행에 도입돼 투자정보 등을 실시간으로 분석하는데 활용될 것이란 전망이다. IBM은 시티은행과 손을 잡고 금융용어와 경제관련 뉴스 등을 왓슨에게 입력 중이다. 이처럼 빅 데이터 제품과 서비스를 선도적으로 제시한 IBM은 시가총액 부문에서 2011년 MS를 제치고 IT 기업 중에는 애플에 이어 2위로 올라섰다.



<이제는 빅 데이터 시대>.2012년 4월 출간.윤형중著.e비즈북스.


신고
크리에이티브 커먼즈 라이선스
Creative Commons License
posted by e비즈북스 2012.05.04 11:51



빅 데이터를 어떻게 정부 운영, 행정에 도입할 수 있을까? 분명 정부가 만들거나 관리하는 수많은 데이터를 체계적으로 활용하면 도움이 될 것 같지만 쉽게 감이 오지 않는다. 하지만 빅 데이터를 통한 정부혁신, 즉 정부2.0에 대해 너무나 쉽게 이해할 수 있는 사건이 2009년 말에 발생했다. 이른바 ‘서울버스’ 사건이다. 사실 이 사건만 제대로 분석해도 향후 빅 데이터 시대에 행정이 어떤 식으로 이뤄져야 하는지를 이해하는데 큰 도움이 된다.

우여곡절 끝에 아이폰이 한국에 2009년 11월 28일 출시되자 일주일 만에 선풍적인 인기를 끄는 앱이 등장했다. 바로 고등학교 2학년 학생이 아이폰을 써보고 일주일 동안 매달려서 만든 ‘서울버스’ 앱이다. 2009년 12월 3일 출시된 이 앱은 버스정류장을 검색하면 그 정류장에 어떤 버스들이 언제 도착하는지를 실시간으로 보여줬다. 이 앱은 출시되자마자 선풍적인 인기를 끌었고 애플 특유의 오픈 플랫폼을 한국에 알리는 계기를 제공했다. ‘앱 이코노미’의 등장을 알리는 서막이기도 했다. ‘서울버스’ 앱을 사용하려고 아이폰을 구매하는 사람들마저 생겼을 정도로 앱은 크게 인기를 끌었고 아이폰 도입을 위해 노력했던 KT의 이석채 회장은 따로 고등학생인 유 군을 불러 “좋은 앱을 만들어줘서 정말 고맙다”고 말했을 정도였다. 유 군은 서울버스 앱에 “제가 곧 고 3이 되기 때문에 업데이트가 늦어질 수도 있습니다. 양해해주시기 바랍니다”고 적었지만 누구도 그를 탓하지 않았다.

하지만 엉뚱한 곳에서 문제를 제기하기 시작했다. 바로 경기도청이었다. 경기도청은 ‘서울버스’가 서비스된 지 2주만인 12월 14일에 ‘공공정보 무단이용이라는 이유’로 ‘서울버스’의 경기도 교통정보 이용을 차단했다. 유주완 군은 경기도가 홈페이지에 공개하는 ‘버스운행정보’를 실시간으로 받아서 앱으로 연결해주는 서비스를 만들었는데 경기도청은 “경기도가 만들어놓은 정보시스템을 개인이 무단으로 이용할 수 없고, 위치정보 사용 등과 관련해 법률적 문제가 있다고 판단해 정보 공유를 막았다”며 “지금까지 여러 민간 기업에서 버스정보를 이용하겠다고 접촉해 왔지만 거절해온만큼 특정 앱만 허용할 수는 없다는 입장”이라고 밝혔다. 하지만 시민들은 “정부가 하지 않는 일을 고등학생이 했는데 행정편의주의적인 마인드로 이를 막았다”고 분개했고 결국 김문수 지사가 뒤늦게 서비스 차단을 풀라고 지시해 이 사건은 사흘 만에 일단락됐다.
















'서울버스' 앱은 정부가 가진 빅 데이터를 어떻게 공유하고 활용할지에 대해 여러 시사점을 제공했다.




이 사건은 두 가지 분야에 대한 시사점을 제공했다. 첫째가 정보를 공유하는 시스템이고, 둘째가 정보의 공개 수준이다.

앞서도 여러 번 강조했듯이 이젠 정보를 모으고 분석하는 능력만큼 정보를 수집하는 동시에 활용할 수 있는 시스템을 만드는 것이 중요해졌다. 수집한 정보를 실시간으로 웹상으로 공개하는 것도 중요하지만 더 나아가려면 ‘오픈 API’, 즉 API 공개를 적극적으로 검토할 필요가 있다. 갑자기 기술용어가 튀어나와 생소하겠지만 결코 어려운 개념이 아니다.

예를 들어 여행전문 홈페이지를 만들었다고 하자. 각 여행지별 명소와 맛집을 상세히 설명했는데 한 가지 아쉬운 점이 있다. 바로 명소와 맛집을 지도 상에 표시하지 못한 것이다. 하지만 이를 위해 지도를 새로 제작할 순 없는 노릇이다. 쉬운 방법은 구글이나 다음, NHN이 제공하는 ‘지도 API’를 사용하는 것이다. 이들이 제공하는 ‘지도 API’를 사용해 웹 페이지를 만들면 지도를 홈페이지에 쉽게 적용할 수 있고 그 위에 직접 만든 여행지별 명소와 맛집을 추가할 수 있다. 만일 경기도와 서울시가 버스운행정보를 API 형식으로 만들었다면 서울버스를 제작한 유주완 군이 더 쉽게 작업을 했을 것이다.

API 공개는 세계적인 IT 기업들이 현재의 위상을 가지는 계기를 마련하기도 했다. 페이스북과 트위터가 지금과 같은 기업이 된 이유도 서비스 자체가 워낙 매력적이기도 하지만, 2007년 API를 공개한 것도 큰 영향을 미쳤다. 페이스북은 2007년 선두 업체인 마이스페이스를 제쳤다. API를 공개하면서 현재 인스타그램, 플리커, 팜빌, 시티빌 등 수많은 프로그램과 게임들이 페이스북과 트위터에서 실행되기 시작했다.

국내에서는 뒤늦게 API 공개 흐름에 참여했고, 현재까지도 미진한 편이다. 2012년 2월 기준으로 공유자원포털상의 서비스제공통계에 따르면 국내에서 제공하는 API는 총 191가지다. 제공 기관과 사업자는 농림수산식품부(33가지), NHN(27가지), 다음커뮤니케이션(18가지), 행정안전부(15가지), 한국정보화진흥원(10가지) 등이다. 해외 오픈 API 현황은 프로그래머블웹을 통해 확인할 수 있다. 이 사이트에 따르면 영미권 정부와 인터넷기업이 공개한 오픈 API는 5039개에 달한다. 한국 정부가 제공하는 오픈 API는 공공취업정보, 식품안전정보, 보육정보, 기상정보, 교통정보 등이지만, 제공하는 정보의 종류도 적을 뿐더러 개발자들이 이런 현황 자체를 모르는 경우가 많다.

다시 ‘서울버스’ 앱 사건이 준 두 번째 시사점으로 돌아가면 정보의 공개범위가 향후 중요한 문제로 떠오를 가능성이 크다. 서울버스 사건에서 경기도청은 “공공정보는 사적인 이익을 위한 목적으로 활용될 수 없다”는 원칙을 고수했다. 이는 일견 맞는 말이다. 하지만 이런 입장을 고수한다면 공공정보의 활용 주체는 정부밖에 될 수 없다. 또한 임의적으로 특정 기업에 독점적 사용권을 준다면 이는 또 다른 특혜로 전락할 가능성이 크다. 이렇기 때문에 아예 공공정보를 특정 기업에 줘서 ‘새로운 이해관계’를 만들지 말자고 주장하는 전문가들이 있다. 주로 정부2.0 프로젝트에 참여하는 이 전문가들은 정보의 특성과 민감도, 개인정보 침해여부 등을 고려해 공개 범위를 결정하자고 주장한다.



<이제는 빅 데이터 시대>.2012년 4월 출간.윤형중著.e비즈북스.

신고
크리에이티브 커먼즈 라이선스
Creative Commons License
posted by e비즈북스 2012.05.03 10:19

머니볼이 알려준 의사결정의 비밀


의사결정은 어느 곳에서나 굉장히 중요한 영역이다. 보통 어느 조직에서나 가장 권력을 가진 곳에서 결정을 내린다. 국가의 중요한 결정은 행정부, 입법부, 사법부에서 내려지고, 기업의 중요 결정은 CEO와 경영진이 하거나 이사회, 주주총회에서 이뤄진다.

문제는 어떻게 의사결정을 잘 할 수 있을 것인가에 대해 정답이 없다는 것이다. 아무리 객관적이고 논리적인 근거를 바탕으로 결정을 내린다고 해도 결국 최종적으로는 특정인의 동물적인 감각에 맡길 때가 많다. 아니면 때로는 결정 그 자체보다는 결정 이후의 노력으로 더 좋은 결과가 나올 때가 많다. 결국 리더는 좋은 결정을 하는 것도 중요하지만, 자신의 결정을 구성원들이 신뢰하게 만들어서 좋은 결과를 낼 수 있도록 독려하는 것일 수도 있다.

이처럼 의사결정이라는 것은 불완전할 수밖에 없다. 하지만 빅 데이터에 대한 이해를 높이면 의사결정 부문에서 상당한 혁신을 이룰 수 있다. 가장 쉽게 와 닿는 사례는 2011년 인기를 끌었던 영화 <머니볼>이다. 이 영화는 미국 메이저리그 오클랜드 애슬레틱스 팀의 실화를 바탕으로 제작됐다.

2000년대 메이저리그에서 가장 가난한 팀을 이끌었던 빌리 빈은 야구를 실제로 해본 경험이 없는 수학 천재를 영입했다. 이 수학 천재는 선수 개개인의 성격이나 사생활보다 철저하게 데이터를 바탕으로 다른 구단에서 외면 받는 선수들을 팀에 합류시켰다. 안타는 잘 못 치지만 볼넷을 잘 고르는 선수를 영입했고, 도루를 잘 하는 발 빠른 선수보다는 타점이 높은 선수를 골랐다. 철저히 몸값 대비 좋은 활약을 할 수 있는 선수들을 선발했고, 출루율과 장타율, 타점 능력 등을 바탕으로 한명 한명이 출중하지는 않지만 이 선수들이 뭉치면 이길 수 있는 팀으로 만들었다. 결국 오클랜드는 최저 예산으로 팀을 구성했음에도 불구하고, 4년 연속 포스트시즌에 진출하는 기록을 남긴다.

















<머니볼>에 나오는 오클랜드 애슬레틱스는 메이저리그에서 가장 돈을 적게 쓰면서도 4년 연속 포스트시즌에 진출했다.




이처럼 <머니볼>은 감에 의지하는 것보다 데이터에 기반해 내린 의사결정이 성공확률이 높다는 것을 보여줬다. <머니볼>과 비슷한 사례는 한국에서도 찾아볼 수 있다. 대표적인 사람이 전 SK 와이번스 감독이었던 김성근 감독이다. SK와이번스는 김성근 감독이 부임하기 이전에는 2003년도에 단 한 차례 한국시리즈에 진출해 준우승을 했을 뿐 대부분 하위권에 맴돌던 팀이었다. 하지만 김 감독이 부임하고 나서는 4년간 3번 우승하고, 1번 준우승하는 강팀으로 변모했다. SK 와이번스가 강해진 원인은 사실 여러 가지가 있다. 김 감독 특유의 지옥훈련으로 끈끈한 조직력을 갖추는 것도 한몫했고, 선수 개개인의 장점을 발견해 그것을 키워주는 능력도 탁월했다. 이것 말고도 중요한 원인으로 꼽히는 것이 바로 ‘데이터 야구’다.

김성근 감독이 부임하자 SK 와이번스에는 4번 타자뿐 아니라, 정해진 타순조차 없어졌다. 대부분의 팀에서는 팀의 최고 타자를 4번 타자로 예우하고 어느 정도 정해진 타순이 있다. 하지만 김성근 감독에겐 어떤 타자가 어떤 투수를 만날 때 잘 하고 어떤 순간에 적절한 역할을 하는지가 유일한 판단 기준이었다. 어제 4번을 치던 타자가 오늘 9번을 칠 수도 있고, 내일엔 후보로 전락할 수 있는 것이 김성근 야구였다. 실제 매일 타순을 뒤집는 실험을 단행했고, 결과는 나름 성공적이었다. 투수 운용도 마찬가지였다. 그는 여러 투수들의 성향과 장점을 다방면으로 분석해 각 상황에 맞는 선수들을 내보냈다. 이렇게 투수 운영을 하다 보니 한 명의 선발투수가 길게 던지기보단 중간에 자주 투수들이 바뀌어 ‘벌떼야구’라는 별칭이 생기기도 했다. 에이스 투수인 김광현 선수를 상대팀 에이스와 맞붙게 하는 게 아니라 상대팀의 3, 4 선발과 붙여서 승률을 높인 것도 철저히 데이터에 기반한 의사결정이었다. 그는 자신의 선수들 뿐 아니라 8개 구단 선수들의 작은 습관과 성향까지 분석해 의사결정을 내렸다. 아무리 팀의 최고 스타라고 해도 결정적인 순간에는 상대팀 선수에게 강한 선수로 교체하는 것이 그의 야구였다. 이는 수비를 할 때도 마찬가지다. 김성근 감독은 상대 타자가 타구를 가장 많이 보내는 방향으로 수비 위치를 이동시켰다.


<이제는 빅 데이터 시대>.2012년 4월 출간.윤형중著.e비즈북스.

신고
크리에이티브 커먼즈 라이선스
Creative Commons License
posted by e비즈북스 2012.05.02 11:59


빅 데이터, 왜 떴을까

빅 데이터는 말 그대로 엄청나게 큰 데이터를 의미한다. 과거와는 차원이 다른 양의 데이터를 지칭하고, 최근엔 양적인 의미를 벗어나 대규모 데이터의 분석과 활용을 포괄하는 용어로도 사용된다.

데이터가 갑자기 폭증하게 된 주된 원인으로 스마트폰이 가장 먼저 꼽힌다. 스마트폰을 통해 언제 어디서나 온라인 접속이 가능해지면서 사용자의 위치정보, 온라인 사용기록 등이 어딘가에 저장되기 시작했다. 특히 스마트폰이 불을 지핀 소셜 네트워크 서비스SNS는 사용자들의 일상생활, 생활의 단상, 의견, 취향 등 깨알 같은 기록을 온라인에 남겼다. 자신의 기록을 남길 뿐 아니라 콘텐츠를 소비하는 주된 플랫폼으로도 활용된다. 이미 많은 사람들이 SNS를 통해 지인들의 소식과 뉴스, 음악, 동영상 등의 콘텐츠를 소비한다.

페이스북 가입자는 빠르게 늘면서 이미 8억 명을 돌파했고, 2012년엔 10억 명 돌파가 확실시되고 있다. 이 사람들이 하루에 하나씩만 메시지를 남겨도 하루 10억여 건의 메시지가 생성된다. 3000만 명의 가입자를 확보한 카카오톡에서 하루 동안 전송되는 메시지도 10억 건을 넘어섰다. SNS는 점차 메시지 전달에서 콘텐츠를 소비하는 플랫폼으로 발전하고 있기 때문에 축적되는 데이터양은 더욱 커질 전망이다.

SNS 외에 스마트폰으로 인터넷에 접속해 검색하는 내용도 어딘가에 기록된다. 구글, 네이버 등의 검색엔진에 특정 키워드를 입력한 횟수 등은 해당 업체의 서버에 저장된다. 스마트폰에 탑재된 GPS칩, NFC칩 등은 위치정보와 구매정보 등을 기록한다. 이젠 사용자의 허락만 받는다면 어디를 자주 돌아다니고 어떤 상품을 구매하는지도 알 수 있다. 이렇듯 스마트폰과 SNS는 이전에 수집되지 않던 엄청난 양의 정보를 모으는 도구가 됐다. 이는 빅 데이터라는 키워드가 부상하게 된 가장 중요한 요인이다.

스마트폰, SNS의 대중화 외에 데이터가 폭증하는 이유는 또 있다. 바로 모든 영역의 전산화가 가속화되고 있기 때문이다. 기업과 공공기관, 비정부기구 등 조직이 있는 모든 곳에서 전산시스템의 도입은 필수가 되고 있다. 하다못해 컴퓨터 한 대는 있어야 일을 할 수 있다. 특히 기업에서 재고와 공급망 관리 혹은 생산비용을 줄이기 위해 업종을 막론하고 전산장비를 적극적으로 도입했다. 오늘날 은행의 전산망이 마비된다면 예금, 대출 등 모든 업무가 마비될 정도로 크게 의존하고 있다. 패션 업체 자라는 판매처의 수요를 즉각적으로 파악해 재고관리, 생산주문에 활용한 결과 세계적인 업체로 성장했다. 심지어는 야구와 같은 스포츠에서도 기록과 팀 전력을 데이터로 만들어 관리하는 기법이 인기를 얻고 있다. 모든 업무가 전산화되는 트렌드는 정부도 예외는 아니다. 정부의 공공서비스는 물론 공공정보 역시 전산화된 시스템으로 수집, 관리되고 있다.

용량이 큰 멀티미디어 콘텐츠의 증가도 데이터가 늘어나는 원인이다. 구글의 유튜브에 업로드 되는 동영상은 2007년 1분에 6시간 분량이었지만, 2010년엔 1분에 24시간 분량이 됐다. 2012년 초에는 1분당 60시간 분량의 동영상이 업로드 되는 등 멀티미디어 콘텐츠가 폭증하고 있다. 향후 LTE 등 4세대 통신망이 대중화되면 동영상 서비스가 빠른 속도로 활성화될 것이라고 전망된다. 이렇게 되면 멀티미디어 콘텐츠의 양도 훨씬 늘어나게 된다.

빅 데이터가 부상하는 마지막 배경은 기기 간에 정보를 주고받는 사물지능통신M2M 센서의 증가다. CCTV, 기상관측기, 오염측정기 등 이미 전 세계에서 사용되는 M2M 센서만 3000만 개에 달한다. 고속도로 CCTV는 교통량을 측정하고, 인공위성의 관측 장비는 기상을 예측하는 용도로 활용된다. 향후 M2M 센서는 의료기기를 비롯해 가축, 차량 등에 부착·탑재될 예정이기 때문에 그 수가 폭발적으로 늘어날 전망이다. 빅 데이터의 특성은 스티브 밀스 IBM 총괄사장이 명쾌하게 설명했다. 그는 빅 데이터의 특성을 ‘3V’로 요약했다. ‘다양한Variety’ ‘다량의Volume’ 정보가 ‘실시간에 가까운 속도Velocity’로 흘러들어 온다는 의미다.

빅 데이터를 세는 단위도 이전과 다르다. 과거 데이터가 많다고 하면 기가바이트GB의 1000배인 테라바이트TB를 연상하는 것이 보통이었다. 하지만 최근에는 테라바이트를 넘어 페타Peta, 엑사Exa, 제타Zetta바이트까지 등장하고 있다. 제타바이트는 기가바이트보다 1조 배 큰 단위다. 2003년까지 생산된 정보가 5엑사바이트에 달하는데 반해 2010년에만 1.2제타바이트의 정보가 생산된 것으로 추정된다. 2020년에는 연간 생성되는 데이터가 35제타바이트로 늘어날 전망이다.



<이제는 빅 데이터 시대>.2012년 4월 출간.윤형중著.e비즈북스.


신고
크리에이티브 커먼즈 라이선스
Creative Commons License
posted by e비즈북스 2012.04.30 12:25


사례 1. 부산에 사는 직장인 이영춘 씨. 갑자기 구글에서 ‘독감 예방접종 추천’이라는 메일을 받는다. 알고 보니 김 씨 인근에서 컴퓨터, 스마트폰을 이용하는 사람들이 자주 ‘감기’, ‘독감’, ‘발열’, ‘기침’, ‘병원’ 등을 검색했던 것이다. 김 씨는 추천받은 대로 독감 예방주사를 맞았다. 그리고 집에 돌아가보니 이미 아내가 독감에 걸려있었다.

사례 2. 중요한 계약을 따내기 위해 유럽 4개 국가로 출장을 가는 윤상현 씨. 독일어, 스페인어, 프랑스어는 물론 영어도 제대로 못하지만 통역사 한 명 데려가지 않는다. 그가 가져가는 것은 단지 스마트폰. 실시간 통역앱을 실행하면 상대방의 말을 바로 통역해준다. 심지어 ‘스페인 바르셀로나 00호텔 옆에서 11월 15일 점심 예약’을 입력하면 적당한 레스토랑들을 찾아서 가격과 메뉴를 한국어로 보여준다. 선택하면 예약은 완료된다.

사례 3. 액세서리를 사러 이대 앞을 방문한 김가인 씨. 스마트폰의 한 앱을 실행하자 이전의 구매이력을 바탕으로 좋아하는 스타일의 제품을 저렴하게 파는 가게들이 소개된다. 쇼핑을 하고 갑자기 파스타가 먹고 싶어졌다. 마찬가지로 반경 1km 안에서 친구들이 가장 많이 추천한 이탈리안 레스토랑을 방문한다.

사례 4. ‘서울 00동에 토네이도 발생’. 국가의 재난위기종합상황실에서 즉각 토네이도 발생 현장 반경 3km에 있는 모든 사람들에게 스마트폰으로 문자를 보낸다. 구호센터는 현장에 있는 CCTV, 위성사진, 사람들이 SNS에 올리는 정보들을 실시간으로 수집해 구조대를 급파한다. 스마트폰에서 지도앱을 실행하면 토네이도의 이동경로가 실시간으로 표시된다.


이 4가지 사례들은 먼 미래의 이야기가 아니다. 빅 데이터를 통해 머지않아 이뤄질 것들이다. 언제부터인가 빅 데이터라는 용어가 언론에 자주 오르내리기 시작했다. 각 분야의 전산화가 가속화되고 특히 스마트폰이 대중화되면서 디지털 데이터의 종류와 양이 폭증했기 때문이다. 어쩌면 조금 어려운 기술용어처럼 느껴지는 빅 데이터가 주목받는 이유는 미래를 내다보는 열쇠이기 때문이다. 엄청나게 쌓이는 데이터들을 어떻게 가공하고 활용하느냐에 따라 비즈니스 세계뿐 아니라 정부와 공공부문의 미래가 바뀔 수 있다. 이렇게 가능성과 잠재력이 크다고 하지만 정작 빅 데이터를 어떻게 활용해야 할지는 잘 감이 오지 않는다.

삼성경제연구소가 국내 211명의 경영자에게 물어본 결과도 비슷했다. 10년 내 빅 데이터 활용의 필요성에 대해 질문한 결과 97.2%의 경영자가 ‘그렇다’고 대답했다. 특히 ‘매우 그렇다’고 답한 비율이 전체의 76.8%에 달했다. 그러나 현재 데이터 관리의 장애 요인을 물었을 때 절반에 가까운 비율이 ‘데이터 분석 및 활용 기술에 대한 이해 부족’을 꼽았다.

데이터 분석 기술에 대한 이해보다도 더 중요한 것은 어떻게 빅 데이터를 가지고 실질적인 변화를 가져올 것인가이다. 그러기 위해선 독자들이 자신의 일과 삶에서 빅 데이터를 접목할 수 있는 ‘시각’을 접하는 것이 중요하다. 이를 위해 이 책은 빅 데이터가 이미 활용되는 사례를 다양하게 담았고 약간의 상상력을 동원해 새로운 비즈니스 모델과 공공기관 혁신 방안을 제시했다. 특히 이 책은 일반인 혹은 IT 분야에 대해 전문적인 지식이 없는 사람들을 위해서 쉽게 썼다. 덤으로 IT 분야에 대한 상식을 넓힐 수 있는 내용들도 담았다. 이 책이 단순히 트렌드 이해를 넘어 보다 많은 상상과 창의를 촉발시키는 촉매제가 되길 바란다.


<이제는 빅 데이터 시대>.2012년 4월 출간.윤형중著.e비즈북스.


이제는 빅 데이터 시대

저자
윤형중 지음
출판사
e비즈북스 | 2012-05-05 출간
카테고리
경제/경영
책소개
이 책에서는 스마트폰과 SNS가 대중화되면서 폭증한 데이터를 어...
가격비교





신고
크리에이티브 커먼즈 라이선스
Creative Commons License

티스토리 툴바