Skip to the content

빅데이터, 해운대 피서객 집계를 부탁해!

▲ 해운대와 송정해수욕장의 정확한 피서객 집계를 위해 빅데이터 수집 기술을 활용합니다

지난해 부산광역시가 해수욕장의 방문객 수를 공개하자 논란이 일었습니다. 우리나라 인구가 5천100만 명인데, 그에 육박하는 4천800만 명이 방문했다고 밝혔기 때문입니다. 피서객 집계가 뻥튀기된 것이 아니냐는 이야기가 나올 수밖에 없었죠. 이에, 부산광역시는 올해부터 SK텔레콤과 넥스엔정보기술의 빅데이터 수집 방식을 활용해 방문객 수 집계 정확도를 높이고자 합니다. 아래 글을 통해 실제로 빅데이터 기술로 집계한 부산광역시 해수욕장 피서객 수는 몇 명인지, 피서객 유형은 어떠한지, 집계에는 어떤 기술이 쓰였는지 확인해보세요.

휴가철 첫 주말, 몇 명의 피서객이 몰렸을까?

▲ 휴가철 첫 주말, 해운대 해수욕장과 송정 해수욕장을 찾은 피서객 수는 몇 명일까요?

SK텔레콤의 빅데이터 수집 결과, 본격적인 휴가철로 접어든 첫 주말인 지난 7월 28~30일, 해운대와 송정 해수욕장을 찾은 피서객은 총 67만 1,030명인 것으로 나타났습니다.

▲ 부산 해수욕장 피서객들의 유입지 분석 지도

해운대와 송정 해수욕장 피서객들의 유입지를 분석해보면 부산광역시(63.6%)가 가장 많았고, 그 외의 지역으로는 경남 김해시(1.04%), 경남 양산시(1.02%), 서울 강남구(0.98%), 경기 성남시(0.86%) 순으로 높게 나타났습니다.

지역별로 해운대 해수욕장 주변을 드나드는 방식이 조금씩 달랐는데요. 서울·경기에서 온 피서객들은 오후에 해운대 해수욕장을 찾은 뒤 저녁 식사나 관광 등으로 외부로 나갔다가 밤이 되면 다시 해운대로 돌아오는 ‘투어형’ 패턴을 자주 보였습니다. 반면 경남과 제주·세종시에서 온 피서객들은 종일 해운대 주변 지역에 머무는 ‘체류형’ 관광 행태를 보였습니다.

시간별, 연령별 해운대 피서객의 유형

▲ 성수기 시간대별 해운대 유동인구 추이 그래프

이번에는 지난 7월 28~30일 사이 해운대에 피서객이 가장 많이 몰린 시간대를 알아보겠습니다. 저녁 7~8시 사이가 가장 많았고 저녁 7시에는 평균 5만7,767명이, 저녁 8시에는 평균 5만7,363명이 해운대에 머물렀습니다. 해운대 피서객이 낮보다 밤에 많은 것은 해수욕을 즐기는 피서객뿐만 아니라, 밤이 되면 해운대 주변에서 저녁을 먹거나 해수욕장 인근 포장마차나 횟집 등에서 시간을 보내는 경우가 많기 때문으로 보입니다.

▲ 성수기 연령별 해운대 유동인구 비교 그래프

연령별로 살펴보면, 성수기에는 40~59세까지가 가장 많아 가족 단위 피서객들이 많은 것으로 분석됩니다. 시간별로 방문 연령 데이터를 분석했을 때, 20대~40대가 다른 연령과 눈에 띄는 차이를 보였는데요. 낮인 13시에 가장 적었으며, 오후를 지나 저녁이 되면서 지속 증가했습니다. 해운대의 낮보다는 밤을 즐기는 이들이 많은 것으로 분석됩니다. 반면, 60대나 10대는 해운대 지역을 벗어나지 않고 한곳에 계속 머무는 경우가 많았습니다. 이들은 해운대에서 해수욕하고, 식사하는 등 시간 대부분을 해운대에서 보내는 것으로 해석됩니다.

피서객 집계는 어떤 기술로 진행될까?

▲ 빅데이터 수집 기술로 해운대의 피서객 수를 분석하고 있는 SK텔레콤 빅데이터 담당자의 모습

앞서, 빅데이터를 바탕으로 휴가철 해운대 피서객의 유형에 대해 살펴봤습니다. 그렇다면, 이러한 데이터는 어떤 기술과 과정을 통해 수집될까요? 실제 해운대에서 피서객 집계를 진행하고 있는 SK텔레콤 빅데이터 담당자로부터 이야기를 들어봤습니다.

집계 방식을 한마디로 설명하면, 휴대폰 안테나의 신호를 감지해 피서객의 숫자를 집계하는 일종의 네트워크 기반 방식이라고 말할 수 있습니다. 다만, 일반적으로 기지국 셀을 이용하게 되면 해운대 해수욕장의 경계선 안에 있는 핸드폰 숫자를 정확하게 측정할 수 없고 오차가 너무 커지게 됩니다.
▲ 유동인구 측정방식인 페르미 산출법과 pCell(방식) 비교

이를 막기 위해 SK텔레콤은 ‘pCell방식’이라는 측정방식을 쓰고 있습니다. 이는 전파맵을 만들어 놓고, 핸드폰 신호가 잡는 주변 기지국 신호의 세기를 측정해서 그 위치를 산정하는 방식입니다. pCell은 중계기까지도 전파맵에 포함시키기 때문에 정확도를 높일 수 있습니다. 이렇게 계산한 특정 지역 내 휴대폰의 숫자와 이동통신 시장점유율, 핸드폰 off 비율 등을 역산해서 전체 유동인구를 추산하게 됩니다.

혹시, 데이터 수집 과정에서 개인정보가 유출되는 것이 아닌지 걱정인 분들이 있다면 안심하셔도 될 것 같습니다. SK텔레콤은 데이터 수집 시 개인을 식별할 수 없도록 하고 있으며, 해당 데이터를 전체 통계로만 활용하고 있으니 말이죠.

더 넓은 범위에 활용될 빅데이터

▲ SK텔레콤의 빅데이터 담당 직원이 해운대에서 수집한 피서객 빅데이터를 분석하는 모습

SK텔레콤은 이번 부산 해수욕장에서 수집한 데이터를 향후 실시간 교통 분야 및 재해∙재난 대처 등으로 활용하는 방안을 고민하고자 합니다. 부산광역시 역시 빅데이터 기술을 CCTV 입지분석, 외국인 방문객 분석, 대중교통 수요 분석 및 치안·응급구조 인력 배치 등에 활용할 예정입니다. 또한, 재난사고 등이 발생했을 때 해당 지역 내 실제 인구의 규모를 정확하게 파악할 수 있어 효율적인 재난 대응이 가능할 것으로 보입니다.

4차 산업혁명을 이끄는 기술 중 하나인 빅데이터. 지금 이 시간에도 데이터가 축적되고 있는 만큼 앞으로 이 데이터를 어떻게 활용할 것인지가 중요한 과제가 될 것으로 예상합니다. SK텔레콤은 이번 부산 피서객 집계를 계기로 빅데이터를 우리 생활에 유용하게 활용할 수 있는 방안에 대해 고민하고자 하니 많은 응원 부탁드립니다.