[배효주의 독서 칼럼] 빅데이터, 나를 도와줘

[빅데이터, 세상을 바꾸다]에서 찾은 ' 누적적 선택'의 힘

‘빅데이터, 생활을 바꾸다'를 읽기 전, 나는 '빅데이터'라는 단어가 가장 눈에 띄었다. 빅데이터, 그게 무엇일까? 사전적 정의로는 말 그대로, 방대한 양의 데이터를 말한다. 이는, 우리 생활 곳곳에 숨어있다. 예를 들어서 가게를 개업하려고 할 때, 어디 장소에 개업해야 할지 고민하는 사람들을 위해, 기존의 데이터를 수집해서, 특정 장소에 가게를 개업했을 경우의 성공지수, 상권지수 등을 분석하여 알려주는 '대박 날 지도'가 있다. 심지어는 내 일상생활과도 아주 밀접하게 연관되어 있었다. 나는 떡볶이를 사랑한다고 할 수 있을 정도로, 떡볶이를 아주 좋아한다. 주말마다 배달 앱을 실행하고, 떡볶이를 주문한다. 이때, 새로운 가게의 떡볶이를 시도해보려고, 그 떡볶이를 먹고 사람들이 남긴 리뷰와 별점들을 보게 된다. 그런데 별점도 빅데이터의 종류 중 하나였다. 사람들이 리뷰와 함께 남긴 별점들을 수집해서, 그것들로 평균을 내서, 그 가게의 별점이 매겨지는 것이다. 덕분에 맛있는 떡볶이 가게들을 알게 되어서, 멀게만 느껴졌던 빅데이터에 고마워진다.

 

그 밖에도 코로나 19 확진자 현황, 특정 제품에 대한 구매량 등등.. 빅데이터는 우리 생활에 쓰여서 한층 편리하고, '누적적 선택'의 힘을 빌려, 반복된 상황에서 어느 정도 다음 상황을 예측 할 수 있게 해준다. 현재 빅데이터는 선택이 아닌 필수가 될 정도로 우리 생활 곳곳에서 리스크를 줄여주고 있다. 그럼 빅데이터는 어떻게 수집되는 것일까? 검색창의 연관검색어, 인기 검색의 등등도 빅데이터를 활용했다고 할 수 있으니, 검색엔진 업체도 빅데이터를 수집하고 활용하는 것이고, 옷 쇼핑몰 앱에도 사람들의 구매율과 리뷰 만족도를 표시해주기 때문에 이도 빅데이터를 활용한다고 할 수 있다. 그러면 빅데이터들은 어떻게 활용해야 좋은 것일까? BC카드 빅데이터센터에서 쓴 '빅데이터, 생활을 바꾸다'를 읽으며, 빅데이터가 정확히 어떻게 우리 생활에 쓰이는 것인지, 빅데이터를 누가, 어떻게 활용하면 좋은지를 알아보았다.

 

 

이 책은 크게 서문, 생활, 금융, 주거, 트렌드, 코로나 이펙트로 나뉜다. 카드사에서 출판한 책답게 위의 파트별로 카드 사용량, 어느 가게에서 카드를 결제했는지 등등 을 이용하여 우리에게 많은 도움이 되는 것들을 알려준다. 어떤 부분들은, 읽고 나니, 그동안 빅데이터임을 몰라보고, 빅데이터에 대해 알지 못했던 과거의 내가 원망스러워질 정도로 활용성과 아이디어가 좋았다.

 

첫 번째로는 소비 데이터에서 나의 이상형을 찾을 수 있다는 것이다. 제목만 보고, 소비 데이터와 나의 이상형은 딱히 관계가 없어 보여서, 조금 의아했었다. 둘에게 무슨 연관성이 있을까? 이 파트는 연구 결과로부터 시작된다. 무작위로 선정된 미국커플 800쌍의 DNA를 분석해본 결과, 자신과 유사한 DNA를 가진 사람을 배우자로 선택할 확률이 높다는 결과를 발표했다. 즉, 자신과 비슷한 사람에게 끌린다는 이야기이다. 그럼 나와 비슷한 사람을 어떻게 찾아야 할까? 여기서 소비데이터가 활용된다. 나와 취미, 흥미가 비슷할수록, 지출하는 품목도 비슷할 것이다. 예를 들어서 내가 반려동물에 관심이 많아서 사료나 반려동물 장난감 등등을 구입했는데, 나와 똑같은 관심사를 가진 사람도 관련 물건들을 구입한것과 같이 말이다. 구입한 것들을 분석해서 소비패턴을 발견한 후, 겹치는 사람을 찾으면, 나와 유사할 확률이 높다. 이것으로 나의 데이트 상대를 찾는 시스템을 만들어 빅데이터를 활용할 수 있다. 1

 

그런데 나의 성격까지 빅데이터로 알 수 있을지 의문이다. 취미는 소비 물품과 큰 연관이 있으니 가능하다고 생각이 들지만, 성격은 그렇지 않다. 개인적으론 나와 취미가 잘 맞아도, 성격이 잘 맞지 않으면 호감을 느끼기 어렵다고 생각한다. 그래서 이 분석 방법에 몇 가지 요소들을 더 추가하고 싶다. 소비를 주로 하는 시간대, 그 밖에도 소비하는 장소를 파악해서 이 사람의 활동 범위와 활동 시간을 파악하는 것이다. 예를 들어 같은 시간대에 여러 옷 가게에서 비싼 옷들을 구매한 것이 여러 차례 발견되면, 명품 소비를 즐기는 과감한 성격의 소유자라고 추측할 수 있다. 또, 주로 선물로 주는 것들을 자주 구매하는 사람이라면, 주변 사람들을 잘 챙기는, 정이 많은 사람이라고 추측할 수도 있다. 물론 선물로 사는 것들이 그 용도가 아닌 본인이 쓰기 위해 산 것이었으면 이 추측은 빗나가겠지만 말이다.

 

이처럼 신빙성은 떨어지지만, 그 사람의 취미만이 아닌 성격까지도 추측할 수 있는 시스템을 만들어야 한다고 생각한다. 요즘 온라인에서 사람을 만나는 일이 점점 많아지고 있다. 내가 자주 하는 온라인 게임에 들어가도, 친구를 하자며 대화를 걸어오는 사람들이 2~3년 전보다 부쩍 많아진 것을 체감할 수 있다. 물론 조심해야겠지만, 내 일상생활보다 온라인에서 만날 수 있는 사람은 전국 곳곳, 어디에나 있으니, 나랑 잘 맞는 사람을 찾기가 쉬울 것이다. 인연을 만들어주는 빅데이터, 정말 낭만적인 것 같다.

 

두 번째로는 '가구 소비 패턴을 알면 마케팅 방법이 보인다'이다. 가족 구성원, 소득수준, 주거지, 주거 형태 등등.. 가구 특징과 각 가구가 소비하는 물품들을 알면, 가구 소비 패턴을 얻을 수 있다. 이런 가구 소비 패턴을 얻으면 유통, 제조업체와 같은 판매자들은 소비자와 관련된 상품들을 추천해주면, 훨씬 효율이 올라갈 것이다. 또한 소비자들은 자신이 찾는 품목을 쉽게 찾을 수 있어서 훨씬 편리해진다. 나는 이런 예를 온라인 옷 쇼핑몰에서 보았다. 여러 상점을 모아서 판매할 수 있게 해주는 앱인데, 내가 검색창에 후드티라고 검색한 뒤 품목들을 둘러보고 다시 많이 페이지로 가보면 어느새 후드티로 창이 가득 차 있다. 또한, 나의 나이, 키, 좋아하는 색상, 몸무게 등등.. 여러 가지 정보를 입력하는 것을 이용해 나에게 맞는 옷을 찾아준다. 전체 소비량으로 추천했던 과거와는 달리, 개인 맞춤으로 물품을 추천하는 것이 훨씬 서로에게 이득이라고 할 수 있을 것 같다. 2

 

이와 같은 예들을 살펴보고 나니, 빅데이터는 우리에게 정말 많은 이익을 준다는 것을 더 확실히 알 수 있었다. 그래서 나도 빅데이터를 활용하여 무언가를 만들어보고 싶었다. 우선 현재의 불편함을 생각해보았다. 최근에 겪은 것 중 하나인데, 어딘가가 아프면 왜 아픈지 검색해보게 되고, 결과들이 나오지 않으면 매우 불안해진다. 그래서 이와 관련해서 빅데이터를 수집해, 불편함을 해결할 수 있게 할 것이다. 우선 아픈 사람이 진료를 받으면, 의사가 진단을 내리게 된다. 이것을 이용해서 환자가 어디가 어떻게, 얼마나 아픈지 체크를 한 다음에 진료 결과로 데이터를 만든다. 처음에는 개인마다 다른 결과이므로 정확도가 떨어질 것이다. 그러나 이것이 여러 개 쌓이면 많은 양의 데이터, 빅데이터가 될 것이다. 그래서 어디가, 어떻게 얼마나 아픈지 입력하면 어떤 문제인지 병원에 가지 않아도 알 수 있는 앱을 만드는 것이다. 사실 어디가 어떻게 아프다고 검색을 하면, 대강 어떤 질병인지 알 수 있다. 그러나 이것은 개개인의 데이터이므로 정확하지 않을 확률이 높다. 여기에 추가로 아픈 사람의 조건, 즉 몇 살인지, 직업은 어떤지, 어떤 신체적 특징을 가졌는지 파악하면, 더 쉽게 자신과 관련된 질병을 찾을 수 있고, 또 내가 걸릴 것 같은 질병들을 예방할 수 있을 것이다.

 

책을 읽고, 내가 빅데이터를 활용해 만들 수 있는 것을 생각해보니, 빅데이터가 소중한 자료임을 더욱 깨닫게 되었다. '누적적 선택'의 힘이 만들어 내는 정확도가 신비로웠다. 기회가 된다면 생각해본 앱을 직접 만들어보고 싶다.

 

빅데이터가 일상생활에도 이용되고 있음은 짐작했지만, 이렇게 체계적인진 몰랐다. 위와도 같이 내 미래에선 빅데이터를 직접 활용하는 기회가 많아질 것 같다. 빅데이터는 수많은 자료 그 이상이다. 수천, 수만 번의 과거들을 기억해 최고의 루트를 짜는, 빅데이터는 과학 같다고 느꼈다. 시행착오와 노고가 담긴 작은 데이터 조각들이 모여 방대한 화살표, 선택, 루트를 이룬 빅데이터는 어찌 보면 정말 아름답다는 생각이 든다. 새로운 도전의 발 받침이 되는 빅데이터는, 지금도 유용하지만 앞으로 인류가 더욱 의지하고, 아껴야할 인류 발전의 자산이다.

 

각주

1. 참고: [빅데이터, 세상을 바꾸다]  中 73p~76p

2. 참고: [빅데이터 세상을 바꾸다]  中 168p~173p

 

 

이 기사 친구들에게 공유하기