SK텔레콤 뉴스룸 실험실(LAB)은 데이터로 사회, 경제 현상을 분석하는 콘텐츠 시리즈를 연말까지 10회에 걸쳐 연재합니다. 시리즈가 다양한 사회, 경제 활동 전망에 도움이 되길 바랍니다.
[바로보기] 1편: 데이터가 세상을 움직인다
[바로보기] 2편: 코로나 시대 하루 이동량은 어떻게 변했을까?
[바로보기] 3편: 빅데이터로 CCTV 최적 위치 선정하고 방범대 순찰 경로 짠다
[바로보기] 4편: 위드 코로나에 활기 되찾은 상권 “이태원, 홍대, 강남 유동인구 크게 늘었다”
「빅데이터로 보는 세상 ⑤」편에서는 SK텔레콤 빅데이터 분석 플랫폼 지오비전이 야구장 부지 선정이라는 공공의사 결정에 활용된 사례를 소개한다.
팬들이 편리하게 이용할 수 있는 야구장 위치는 어떻게 정할 수 있을까
경상남도 창원시를 연고로 하고 있는 ‘NC 다이노스’. 2011년 KBO 리그 아홉 번째 구단으로 창단했다. 창원시는 2014년 당시, 새 야구장 입지 선정을 시작하였고, 후보 1순위는 창원종합운동장, 마산종합운동장이 2위, 진해 옛 육군대학 터가 3순위였다. 당시 일반적인 시각으로 ‘창원종합운동장’이 접근성이 가장 유리한 것으로 알려졌다.
하지만, NC 다이노스 새 야구장으로 선정된 곳은 2순위였던 ‘마산종합운동장(현 창원NC파크/마산야구장)이었다. 이 결정엔 SKT의 빅데이터 분석 플랫폼 ‘지오비전’이 큰 역할을 했다.
창원시는 세 곳의 후보지 중 최적의 위치를 선택하기 위해 빅데이터를 활용했다. 창원시는 공공 데이터인 안전행정부, 국토해양부, 통계청 자료와 민간 데이터인 지오비전 유동인구 데이터, 내비게이션 목적지 자료를 융복합 분석해 세 후보지의 15분, 30분, 45분, 60분 거리* 내 주거인구와 직장인구(유동인구)를 추출했다.
* 해당 시간은 차량으로 이동 기준. T맵의 경로탐색으로 도착할 수 있는 거리를 기준으로 함
분석 결과, 마산종합운동장은 차량 이동 기준으로 15분 거리 내 주거인구 41만 2,540명, 직장인구 18만 9,407명, 창원종합운동장은 15분 거리 내 주거인구가 6만 538명, 직장인구 1만 5,030명이었다. 최종 후보로 결정된 마산종합운동장과 1순위로 고려되었던 창원종합운동장의 15분 거리 내 직장인구 차이는 17만 4,377명, 주거인구는 35만 2,002명이나 차이가 났다.
빅데이터에 기반한 과학적 의사결정은 사회적 비용을 획기적으로 줄인다
창원시 야구장 위치 선정 사례처럼 공공 정책은 추진 과정에 있어 많은 이해관계자들이 존재하고, 의견 수렴이 필요하다. 이러한 상황에서 빅데이터가 제시하는 결과는 과학적인 의사결정을 가능하게 하고, 사회적 비용과 시간을 획기적으로 단축시킨다. 뿐만 아니라, 더 효율적으로 행정 서비스를 할 수 있게 된다.
특히, 다양한 빅데이터를 융합하면 한 가지 데이터를 활용해 의사결정 할 때보다 최선의 결과를 도출할 수 있다.
연령, 시간대별 등 세밀한 유동인구 데이터 분석은 보다 정밀하고 과학적인 의사결정을 만든다
고정 데이터인 주거인구 이외, 창원시 사례에서 살펴봤듯 직장인구와 같은 유동인구 데이터는 보다 복합적이고 정밀한 데이터 분석을 가능하게 한다. 더 나아가 유동인구를 연령별로, 시간대별로 세밀하게 분석할 수 있다면 데이터 결과는 더 정밀할 수밖에 없다.
지오비전으로 올해 8월 서울시 유동인구를 깊게 들여다봤다. 서울시의 01시부터 24시까지 시간대별 인구밀도 변화를 확인할 수 있다. 녹색에서 적색으로 갈수록 인구밀도가 높은 지역이다.
코로나19 확산 전·후 유동인구 밀집 지역 분포 차이는 어떻게 달라졌을까? 올해 8월과 ’19년 8월을 비교해봤다. 대체적으로 분포 형태는 비슷했다. 단, 오후 12시와 저녁 7시 등 점심, 저녁 식사 시간대에서 차이가 나타났다. 코로나19 확산 후, 서울 북부(도봉/성북/강북/중랑/노원구)와 서울 남부(강서/양천/영등포/동작구) 인구밀도가 높아졌다. 코로나19 확산 후, 이동의 제약이 생기며 서울 주요 주거지 지역에 유동 인구가 많아진 것으로 보인다.
이러한 유동인구 상세 분석은 마케팅, 창업 등 민간 분야에 유의미하게 활용될 수 있다. 강남역 인근 유동인구를 성별, 연령대별로 나눠 인구분포도를 만들어봤다.
남성과 여성 유동인구는 강남역을 기준으로 위/아래로 뚜렷하게 나누어진 것을 확인할 수 있다. 여성은 강남역을 기준으로 북쪽 상권을 중심으로, 남성은 강남역 남쪽 상권에 넓게 퍼져 과밀하게 분포해 있다. 단, 아래 20대 유동인구 분포도를 보듯, 강남 유동인구의 주 연령대를 차지하는 20대 남녀 모두 북쪽 상권에 몰려있는 것을 확인할 수 있다. 북쪽 상권은 강남의 메인 스트릿으로 유동인구가 많은 곳이다.
연령대별로는 어떠할까? 10대는 강남역을 기준으로 서쪽 상권의 위쪽과 아래쪽에 몰려있다. 위쪽은 서초초등학교, 서일중학교와 아파트 단지가, 아래쪽은 서운중학교, 서이초등학교, 역삼초등학교와 아파트 단지가 있다. 이 때문에 강남역 서쪽에 10대 유동인구가 많은 것으로 분석할 수 있다.
20대는 강남역을 기준으로 북쪽 특히 강남대로 주변과 동쪽을 중심으로 유동인구가 많은 편이다. 옷 가게, 음식점, 술집, 카페 등 패션/먹거리가 있는 메인 상권이라 젊은이들이 많이 붐볐다.
30~40대와 50~60대+는 강남역 아래쪽 상권에 몰려 있다. 해당 지역은 아파트 단지 등 주거 지역이 형성되어 있다. 강남역 성별/연령별 유동인구 밀집 지역 분포는 코로나19 확산 전·후 차이가 크지 않고, 거의 유사했다.
객관적인 데이터를 기반으로, 강남구에서 20대를 주 타깃으로 하는 마케팅 활동 또는 창업을 한다면 강남역 기준 북쪽 상권으로, 30~40대 이상을 주 타깃으로 하는 활동이라면 남쪽 상권을 추천할 수 있다.
강남 지역뿐만 아니라, 다른 지역도 동일한 분석이 가능하다. 부산 서면 지역의 유동인구를 젊은층(10~30대), 중/장년층(40~60대)로 나눠 각각 인구밀도를 확인해봤다. 서면역을 중심으로 좌측 상권은 중/장년층이, 우측 하단 지역은 젊은층이 많았다. 강남역 인구밀도와 마찬가지로 서면 지역도 코로나19 확산 전·후 분포는 변동이 없었다.
예비 창업자에게 입지와 업종 선정은 창업에서 무척 중요하다. 그러나 객관적인 데이터에 접근하기가 쉽지 않은데 이러한 지역 상권별 다양한 데이터는 의사결정을 하는데 도움이 된다. 소상공인시장진흥공단 소상공인마당 상권정보[바로가기]에서 SKT의 지오비전 유동인구 데이터를 활용할 수 있다.
우리 일상에 영향을 미치고 있는 빅데이터 분석
사회 안전과 공공, 민간 등 폭넓게 쓰이고, 의사 결정 과정에 기여하고 있는 ‘빅데이터 분석법’에 대해 살펴봤다. 빅데이터는 공공 기관에는 과학적 정책 의사결정에, 민간 기업에게는 비용 절감과 수익 창출에 도움을 준다. 소상공인 등 자영업자에게는 창업 시 실패를 낮추고, 스타트업에는 새로운 비즈니스 모델을 발견할 기회를 제공한다.
다음 「빅데이터로 보는 세상 ⑥」편에서는 지오비전의 가장 큰 장점인 상권 분석 데이터를 통해 코로나 전후 달라진 대한민국 상권 현황을 소개한다. 해당 내용은 SK텔레콤 뉴스룸에서 처음 공개하는 최신 데이터로 소상공인, 스타트업 종사자들에게 인사이트를 제공할 것으로 기대한다.