[이원섭의 通] DB, 인사이트 그리고 보는 눈이 달라야 한다
[이원섭의 通] DB, 인사이트 그리고 보는 눈이 달라야 한다
  • 이원섭 IMS 대표
  • 승인 2019.11.30 23:24
  • 댓글 0
이 기사를 공유합니다

최근 지방자치단체 곳곳에서 소위 말하는 전문 연구기관의 잘못된(의도적 과장, 발주기관의 요구에 맞춘) 수요예측 데이터들로 인해 멈춰선 경전철이 한, 두 곳이 아닙니다. 이 전문 데이터를 믿고 수조의 공사비를 투자하고 또 지역주민들의 발전 기대를 한껏 부풀리게 했지만 결과는 부정의 데이터로 인한 대국민 사기 데이터였다는 사실이 혀를 차게 합니다.

이 데이터 이야기를 오늘 하려고 합니다. 요즘 가장 관심을 받는 분야중의 하나가 빅데이터입니다. 전 개인적으로 빅데이터라는 용어를 좋아하지 않습니다. 정확하게 모르는 사람들은 빅이라는 말에 양(量)의 개념으로 받아들여 SNS 등의 수많은 데이터들을 빅데이터와 연관을 짓곤 합니다. 전혀 무관하지는 않지만 빅이라는 단어에 집착해 수많은 데이터라는 잘못된 인지를 많이 봅니다. 그래서 저는 개인적으로 설명을 드릴 때 빅데이터라는 용어 보다는 그레이트(great)라는 개념의 데이터라는 내용으로 설명을 드리 곤 합니다. 저도 한 분야(마케팅커뮤니케이션)의 일을 20여년 이상 하다 보니 새로운 개념이나 용어를 만들어 내는 것을 참 좋아합니다. 지금 “그레이트 데이터”라고 말씀드리는 것도 같습니다. 저는 전문가로 인정을 받고 있지는 못하지만 자기만의 개념이나 용어를 잘 만듭니다.(지난 글 3RM처럼…) 하지만 이런 것들은 완전 새로운 것이라기 보다는 기존의 것들보다 조금 더 진화하고 변화한 것들이 대부분입니다. 빅데이터도 이미 있었던 것들을 조금 더 진화시킨 개념의 다름 아니라는 말씀입니다.

렌탈 서비스, ASP, Saas, 클라우드 등처럼 조금씩 바뀐 같은 개념을 다르게 표현하려는 전문가들의 의도입니다. 그래야 존재가(?) 가능 할겁니다. 빅데이터도 그 속을 보면 개념없이(?) 쌓여 있는 개더링(gathering)한 로데이터들을 원하는 목적에 맞게 마이닝(mining)해 통계, 분석한 가공 데이터입니다. 따라서 이런 개념은 이미 다 존재했고 또 기 사용하던 것을 새로운 개념으로 재정립한 것입니다.

우리나라에도 진출해 있는 스페인 패션 유통 기업 자라(ZARA)의 빅데이터 사례를 보면 제 말씀을 쉽게 수긍하실 겁니다. 저도 대학 때 아르바이트를 하며 고속터미널 지하 상가에서 옷 장사를 한 적이 있습니다. 당시 가장 골치거리가 팔다 남은 재고 문제였습니다. 특히 하의의 경우는 사이즈 별로, 컬러 별로 다 구비를 해야 팔 수 있기에 이런 다품종은 더욱 문제이지요. 그래서 나중에는 프리사이즈의 단품 상의만 전문적으로 파는 지혜(?)를 얻어 그나마 재고 문제를 해결한 적이 있었습니다. 그런 지식은 없었지만 경험적으로 나름 분석해 본 결과 사이즈가 다양하지 않고 종류도 다양하지 않은 제품이 제고가 없고 나중에 처리하기 편하다는 지금의 빅데이터 값을 몸으로 얻어낸 겁니다.

자라는 전 세계 유통망으로 수 천의 매장을 가지고 있으니 이 골칫거리 재고 문제는 경영상에 큰 해결 과제였을 겁니다. 그래서 자라는 빅데이터를 이용해 이 문제를 풀어냅니다. “소량생산 적기 판매”(재고최소화)라는 목적을 가지고 미 MIT 공대 데이터 전문가들과 함께 연구를 진행합니다. 전 세계 매장에서 어떤 제품이 잘 팔리는지 매장에서 입력되는 데이터들을 실시간으로 분석해 고객의 니즈를 파악한 후 잘 팔리는 제품 중심으로 바로 생산해 판매하는 “최적화 생산법”을 찾아 냅니다. 자동 대량 생산의 기존 시스템을 버리고 빅데이터에 의한 새로운 방법론을 과감히 따른 것입니다.

그 결과 빅데이터를 이용한 최적화 방법은 재고 문제를 해결함과 동시에 최신 트렌드에 맞게 반영해 가장 빠르게, 다품종 소량생산을 하는 패스트(fast) 패션업체라는 닉네임도 덤으로 얻는 행운을 가집니다.

빅데이터는 이처럼 어떤 특정한 목적을 가지고 개더링한 데이터들 중에서 꼭 필요한 데이터들을 잘 마이닝해서 통계 분석을 통해 얻어지는 정제된 데이터들입니다. 이 분석 데이터에 따라 자라는 상품 수요 예측, 각 매장별 적정 재고 산출, 상품별 가격 결정도가 추출될 수 있었고 이 데이터에 따라 각 매장 수요 관리를 정확히 예측이 가능했던 겁니다.

또 다른 데이터 이야기로 데이터 저널리즘에 대한 이야기를 하려 합니다. 2009년 영국 가디언지의 “데이터 블로그”가 데이터 수치에 근거한 기사를 게재해 큰 호응을 얻습니다. 온갖 다양한 숫자(데이터)에서 의미(자라처럼 목적이)있는 정보들을 찾아 독자에게 전달하면서 데이터 저널리즘은 부상을 합니다.

하지만 이 또한 전혀 새로운 개념의 저널리즘은 아닙니다. 지금 청와대 대변인으로 있는 김행 대변인도 과거 중앙일보 기자시절 데이터 리서치 전문기자로 유명했습니다. 어쩜 김행대변인이 이미 데이터 저널리즘 전문기자였을지도 모릅니다. 하지만 지금에 와서 데이터 저널리즘이 부각되는 것은 빅데이터처럼 이 시기와 맞아 떨어지는 시대성과 환경의 발전 때문입니다.

과거에는 지금처럼 누구에게나 열려있는 데이터 평등시대가 아니었습니다. 누군가에게 독점이 되는 시기였고 또 그래서 작의성을 가지고 조작을 해도 검증이 불가능한 데이터 불평등시대였기에 지금처럼 누구나 호응하는 시기는 아니었습니다. 하지만 누구나 개방, 공유, 참여가 가능한 데이터 평등시대가 열리면서 데이터 저널리즘은 호응을 받게 됩니다.

위키리크스 같은 웹사이트로 각종 비밀 데이터들이 누구에게나 열리게 되는 시대에 살고 있고 또 기존 유명 언론사도 못하고 정부도 파악하지 못했던 조세피난처 데이터를 공개한 뉴스타파 같은 인터넷 언론사도 바로 이 데이터들로 인해 새로운 스타로 부상하는 것입니다.

이제 데이터 이야기는 그만하고 그 데이터들을 빅데이터로 만드는 시각에 대한 이야기를 합니다. “구슬이 서말이라도 꿰어야 보배”라는 우리 속담처럼 아무리 많은 데이터를 가지고(개더링한) 있어도 목적에 맞게 꿰지(마이닝) 못하면 빅데이터(보배)가 될 수 없습니다. 이 데이터들을 제대로 보겠다는 생각과 분석, 파악할 수 있는 눈이 있어야 합니다. 빅데이터를 빅데이터로 만들고 데이터 저널리즘으로 만드는 것은 보는 눈이 달라야 합니다. 이 보는 눈이 다른 것이 바로 인사이트(insight, 통찰)입니다.

인사이트는 하루 아침에 얻어 질 수 없는 연륜도 필요하고 그 분야에서 오랜 경험과 노하우를 가진 large insight(탁견)를 가진 꿰뚫어보는 자(insighter)만의 탁월한 능력입니다. 인사이트가 없다면, 보는 눈이 다르지 않다면 아무리 많은, 좋은 데이터들이 있어도 그림의 떡에 지나지 않습니다.

인사이트의 출발은 아니러니 하게도 안(in)이 아닙니다. 바깥(out) 입니다. 이 빅데이터를 누가 보고, 이 저널의 독자는 누구인가의 시각에서 보아야 합니다. 필요로 하고 사용하려는 상대의 말이나 의견에 귀를 기울이는 이타심의 자세가 great insight를 만들어 냅니다. 발주처의 시각에 맞춘 데이터가 경천철의 데이터이며 각종 허구의 데이터들로 언론에 보도된 데이터 저널리즘은 인사이트가 없는 저널리스트들이 사용한 데이터들로 인해 얼마나 많은 선량한 독자들이 오해를 하고 있는 지 돌아봐야 합니다.

수없이 제공되어 있는 데이터들이 항상 제대로 된 것도 아니며 옳은 것도 아닙니다, 로데이속에도 의도를 숨기고 공개를 빙자한 조작 데이터들도 항상 존재합니다. 인사이트가 있는 데이터 저널리스트들이라면 이것도 잘 정제합니다. 언제나 있는, 누구나 볼 수 있는 데이터들을 보는 눈이 다른 시각으로 인사이트를 찾아내는 노력으로 데이터를 바라보아야 합니다.

이원섭 대표
이원섭 대표

 


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.