Skip to the content

[딥데이터] 사람들은 어디로 어떻게 왜 이동할까?

※ <딥데이터>는 SKT의 위치 기반 데이터 분석 기술인 ‘리트머스(LITMUS)’를 통해 경제 및 사회 인사이트를 제공하는 기획 시리즈입니다. 앞으로 다양한 트렌드와 결합한 데이터를 순차적으로 공개할 예정입니다. 분석 자료가 고객의 삶에 최적화된 서비스를 제안하고, 사회 문제를 해결하는 데 활용되길 기대합니다.

딥데이터, 리트머스, LITMUS, 위치지능화데이터

리트머스❲LITMUS❳는 SK텔레콤이 보유하고 있는 다양한 위치 기반 데이터를 분석해 ‘이동’과 ‘체류’에 담겨 있는 사람들의 이야기를 추정하고 구체화하는 ‘위치 인텔리전스 시스템❲Location Intelligence System❳’이다. 리트머스❲LITMUS❳는 위치 기반 데이터에 담겨 있는 ‘인간의 삶의모습’에 주목한다. ‘이동’과 ‘체류’를 분석해 개인의 행동을 분류하거나 미래의 행동을 예측할 수 있기 때문이다.

‘이동’과 ‘체류’ 분석해 사회 문제 해법 제시하는 ‘리트머스❲LITMUS❳’

단순한 위치 정보를 가지고 보다 풍부한 위치 기반 서비스를 제공하기 위해서는 데이터의 가공이 필수이다. 리트머스❲LITMUS❳는 몇 가지 단계를 거처 위치 정보에 부가가치를 더해 서비스에 필요한 정보로 변환한다.

딥데이터, 리트머스, LITMUS, 위치지능화데이터

리트머스(LITMUS)는 먼저 점 단위의 위치 정보를 시공간 단위로 분류한다. 이때 군집을 형성하는 요소들의 위치 정보를 하나로 모아 ‘이동’인지 ‘체류’인지 추정한다. 이를 통해 사용자 이동에 대한 전반적인 정보인 ‘트립’을 만든다. 나아가 이 ‘트립’이 어떤 의미인지 확인하는 과정을 거쳐 비즈니스 인사이트를 도출한다.

딥데이터, 리트머스, LITMUS, 위치지능화데이터

리트머스(LITMUS)에서 집중하고 있는 부분은 “데이터 분석”이다. 기존 GIS(지리정보시스템)에서는 특정 지역에 있는 점들의 통계를 제공했다. 반면, 리트머스(LITMUS)는 점(위치) 데이터를 면과 선으로 구분 후 각각 ‘체류’와 ‘이동’이라는 맥락으로 해석한다. 각 맥락의 의미를 체류의 목적(집, 회사 등) 또는 이동의 수단(버스, 지하철 등)으로 추정할 수 있다. 리트머스의 분석 데이터는 익명화된 통계데이터가 활용되고 있어 개인을 특정할 수 없다. 따라서 개인 정보 및 위치 정보에 따른 이슈가 발생하지 않는다.

SKT는 빅데이터, AI, 교통/도시 공학 등의 다양한 기술의 발전에 힘입어 신뢰도 높은 분석을 진행한다. 이는 이동과 체류를 단순 위치 앱 로그 등으로 통계 처리하는 것과 다르게 난이도가 높은 분석 기술을 요구하는 것이 특징이다.

■ 리트머스(LITMUS)에 담긴 의미는 이것!
리트머스(LITMUS)는 SKT의 위치 인텔리전스 기술을 일컫는 이름이다. 리트머스(LITMUS)는 우리가 흔히 알고 있는 대중적인 인지도를 가지고 있는 지시약이다. 이 단어는 “사회 현상을 판단하는 기준점”이라는 관용어로 쓰이기도 한다. SKT는 이 점에 착안하여 “특정 위치에 리트머스 분석을 하면, 해당 위치를 분석할 수 있다”라는 의미를 담아 리트머스(LITMUS)라는 이름을 붙였다.

리트머스의 차별화 된 세 가지 기술

SKT의 리트머스❲LITMUS❳는 세 가지 차별점을 앞세워 고객의 삶에 최적화된 서비스를 제안하고 있다.

딥데이터, 리트머스, LITMUS, 위치지능화데이터

리트머스❲LITMUS❳의 첫 번째 차별점은 고객 여정 분석이다. 리트머스❲LITMUS❳는 위치의 시작과 끝을 기록하는 근본 데이터인 ‘이동’과 ‘체류’를 구분하고 사용자의 ‘집’을 추정하여 트립 체인을 구성한다.

고객 여정의 시작점은 집이다. 시공간 상의 데이터에서 고객이 높은 확률로 회귀하는 군집을 분석하여 집을 추정한다. 일반적으로 새벽에 체류하는 위치를 집으로 추정할 수 있는데, 고객의 직업이나 생활 패턴에 따라 새벽에 체류하는 지역이 근무지일 확률도 존재한다. 리트머스❲LITMUS❳는 자체 딥러닝 기술을 통해 ‘집’이라는 공간을 정확도 높게 추정한다.

두 번째로 체류 목적을 구분할 수 있다. 이는 이동 간 어떤 목적이 있는지 추정하는 모델이다. 리트머스❲LITMUS❳는 체류 이벤트의 순서를 딥러닝 학습하여 고객의 체류 목적을 추정한다.

체류 목적을 추정할 때는 고객의 장시간(7일 이상)의 이동과 체류의 연속 패턴을 학습한다. 그런 다음 기초 추정한 집의 위치, 고객 프로파일(나이 등) 및 지역의 특성(상업/업무 지역 등)을 복합적으로 학습해 체류 목적을 추정한다. 예를 들어보자. 30대 남성이 평일 중 집을 떠나 동일한 위치에 체류하는데, 해당 지역이 업무 지역으로 추정되면 높은 확률로 출근 목적으로 체류한다고 볼 수 있다. 다만, 코로나19로 인한 재택인 경우도 있어 추가 특성들을 고려할 필요가 있다.

리트머스❲LITMUS❳ 현재 ▲귀가 ▲출근 ▲등교 ▲쇼핑 ▲관광 ▲기타 등 여섯 가지 목적으로 구분할 수 있으며, 향후 기타 부분을 세분화하는 것이 목표이다.

마지막으로 이동 수단을 구분하는 기술이다. 수단 분석은 까다로운 모델 작업이다. 먼저 위치의 ‘점’을 ‘선’으로 연결한다. 그런 다음 ‘선’이 내포한 데이터의 특징인 속도, 방향 등을 추출하여 수단의 특정별로 분류한 후 노선 및 출발지, 도착지 정보를 매칭해 분류하는 방식이다.

리트머스❲LITMUS❳는 트립 결과를 전국의 지하철, 버스(시내버스, 마을버스, 광역버스 포함) 등의 노선 및 운영 정보와 매칭하고 학습시켜 사용자가 이동 중 어떤 이동 수단을 탔는지 구분한다. 물론 자차, 도보 등도 구분할 수 있다. 리트머스❲LITMUS❳는 향후 철도, 마이크로 모빌리티(공유 자전거, 공유 킥보드 등)의 이동 수단도 구분한다는 계획이다.

리트머스의 비전

리트머스❲LITMUS❳는 ‘편안하고 안전한 삶’을 위한 기술을 개발하고 있다. 이동 및 삶의 방향을 예측해 최적의 개인화 추천을 진행하고, 위험 요소를 사전에 분석해 제거하는 것이 목표이다.

SKT Location팀 안홍범 팀장은 “우리 고객의 삶은 이동과 체류의 연속으로 표현할 수 있다”라며 “고객의 삶에 가장 밀착된 연결 서비스를 제공하는 이동통신사업자로서 고객의 삶을 잘 이해하여 각 고객의 삶에 최적화된 서비스를 제안하고, 나아가서는 사회 문제를 함께 해결하는 것이 리트머스❲LITMUS❳의 비전”이라고 밝혔다.

리트머스(LITMUS) 분석 기술을 바탕으로 진행하는 이번 <딥데이터> 시리즈는 총 7편으로 발행할 예정이다. 이어지는 2편은 직장인 출근 시 이동 수단 별 통근 패턴에 관한 데이터를 살펴보고, 리트머스의 데이터로 우리 사회의 교통 문제를 해결하는 방법에 관해 다룰 예정이다.
 

딥데이터, 리트머스, LITMUS, 위치지능화데이터

 

■ 개인정보 없이 세상을 분석하는 빅데이터 기술

 
1. 빅데이터를 다루는 기업은 모든 개인정보를 볼 수 있는 것 아닌가?
흔히 알고 있는 개인정보는 특정 개인을 식별할 수 있는 가능성을 포함한 정보다. 빅데이터 분석은 개개인의 특정 정보를 모으고 활용한다는 의미가 아니며, 연령 · 성별 · 거주지별 등 다양한 항목에 따른 행동 패턴을 살펴 새로운 가치를 만드는 활동이다. 때문에 빅데이터 분석에는 익명화된 통계 데이터가 활용되고 있다.

 
2. 데이터를 안전하게 처리하는 방법 중에 가명 결합은 무엇인가?
가명정보는 데이터에 가짜 명칭을 부여한 정보로, 개인을 식별하지 못하는 수준으로 익명화된다. 가명결합은 기업 혼자 하는 것이 아니다. 신뢰할 수 있는 공공기관을 통해서만 결합이 이루어지며, 가명정보로 이 정보가 누구의 정보인지 특정할 수 없게 된다. 이를 법으로 규정하고 있다.

 
3. 익명화, 가명화 하는 기술 · 절차는?
‘익명화’는 개인식별정보를 영구적으로 삭제하거나, 개인식별정보의 전부 또는 일부를 기관의 공유식별기호로 대체하는 것이다. 익명화 절차는 데이터 세트에서 개인을 식별할 수 있는 요소를 전부 또는 일부 삭제하거나 대체하여 더 이상 개인을 알아볼 수 없도록 조치한 후, 적정성을 평가한다.

 
‘가명화’는 가명결합전문기관이 개인정보의 일부를 삭제하거나 일부 또는 전부를 대체하는 등의 방법으로 추가정보 없이는 특정 개인을 알아볼 수 없도록 처리하는 것을 의미한다. 정보에 따라 일반화, 범주화, 레코드 삭제 등의 기법을 활용한다.
가명화는 ①가명신청법인과 가명처리 대상/목적을 합의하고 데이터 추출 준비 → ②가명처리 목적/처리/이용환경/이용주체에 대한 위험도 분석과 데이터의 특성을 분석하여 가명처리 방법과 수준을 정함 → ③식별자 삭제/대체, 암호화(랜덤값/해시값 적용 후 암호기술적용) 한 후 일반화, 범주화 기법을 이용하여 가명처리 → ④가명처리한 결과물에 대해 결합기관(법인)이 개인 식별 가능성을 외부 전문가를 활용하여 적정성을 검토하는 단계를 거친다.

 
익명화와 가명화는 법적으로 허가 받은 법인만 처리할 수 있으며, 개인정보 관리법인의 업무 특성에 따라 가명결합법인도 달리 해야한다.

콘텐츠 사용 안내
이 콘텐츠는 공유, 인용, 배포가 가능하며
사용 시에는 ‘SK텔레콤 뉴스룸’으로
출처 표기
를 부탁드립니다.

문의하기

콘텐츠 사용 안내
콘텐츠 사용 시에는 SK텔레콤 뉴스룸 출처 표기를 부탁드립니다.
카카오 채널 안내
SK텔레콤 뉴스룸 채널을 추가해 보세요.
추가하기

이 콘텐츠가 SK텔레콤을 이해하는데 얼마나 도움이 되었나요?

답변 선택하기