SIGIR 2024 우수논문상을 수상한 개인화모델링팀. 왼쪽부터 데이터 사이언티스트 조민철 님, 윤형준 님, 김태산 님, 유예림 님, 박정 님. 당일 사진촬영에 참여하지 못했지만 최민성 팀장, 홍준의 님이 함께 논문에 참여했다.
SK텔레콤은 지단 달 개최된 SIGIR 2024(International ACM SIGIR Conference on Research and Development in Information Retrieval)에서 자체 개발 추천 모델 알고리즘 연구가 우수 논문상(Best Paper Honorable Mention)을 수상했다고 밝혔다. SIGIR 2024는 정보 검색 분야 세계적 권위의 학회로, SKT가 수상한 우수 논문상은 접수 논문 중 상위 0.6%의 논문에만 수여된다. 이 논문은 SKT의 ‘One Model 버전 2.0’에 관한 연구로 해당 알고리즘의 참신성, 상용 배포 실증성, 방대한 실험을 통한 결과의 신뢰성 등에서 높은 평가를 받았다. 논문에 참여한 SKT 구성원을 만나 논문에 대한 더 자세한 이야기를 들어봤다.
AI 기술 발전과 인재 모집에도 기여, SIGIR 2024수상의 의미
SIGIR 2024 우수논문상을 수상한 개인화모델링팀. 왼쪽부터 데이터 사이언티스트 조민철 님, 윤형준 님, 김태산 님, 유예림 님, 박정 님. 당일 사진촬영에 참여하지 못했지만 최민성 팀장, 홍준의 님이 함께 논문에 참여했다.
Q. SIGIR 2024 수상 소감을 부탁드립니다.
수상을 전혀 예상하지 못했는데, 우리가 가진 문제의식과 깊이 있는 고민이 세계적인 기업과 학계가 모인 곳에서도 높은 평가를 받을 수 있다는 생각에 더욱 자신감이 생겼습니다.
Q. 이번에 수상한 논문의 One Model은 어떤 서비스인가요?
One Model은 SKT 고객들의 다양한 행동로그를 종합적으로 이용하여 고객이 가장 관심 있어 할 만한 SKT 서비스를 제공하는 통합 추천시스템입니다. 2023년에는 SKT의 서비스 데이터 중 10여 개 데이터를 모두 이용한 One Model 버전 1.0, 올해 초에는 효율성을 향상시킨 One Model 버전 2.0을 개발했고, 최근엔 LLM 기반의 통합 추천시스템인 One Model 버전 3.0을 개발했습니다. 이 모델들은 사내에서 운영 중인 여러 개의 추천 서비스 데이터들을 통합하여 운영의 효율성과 추천 성능을 높였습니다.
Q. 이번 수상은 팀에게 어떤 의미였나요?
작년부터 최근까지 One Model 버전 1.0과 버전 2.0, 버전 3.0을 연이어 개발하고 발전시키는 과정이 있었는데요. 그 과정 자체가 저희 팀에게 큰 의미가 있었습니다. 논문을 작성하고 실무에 적용하는 모든 과정에서 데이터 사이언티스트로서 역량을 강화하고 연구개발의 여정을 일목요연하게 정리할 수 있는 시간이었습니다.
Q. 이번 SIGIR 2024 수상은 SKT에 어떤 의의가 있나요?
기업을 포함한 연구 그룹들은 그들이 가진 기술력을 입증하기 위해 논문이라는 객관적, 정량적 지표를 사용합니다. 우리의 기술이 세계적인 학회에 게재 승인이 되고 더 나아가 우수 논문상을 수상한 것은, 세계 최고 전문가들로부터 그 기술력을 인정받은 것임을 의미합니다.
또한, 우리와 유사한 업무를 하는 글로벌 기업들의 연구자들과 서로 기술을 공유하면서 검색, 추천 기술 발전에 기여한다는 의미도 갖습니다. AI 인재들 역시 이런 연구개발과 실무적 증명을 함께 해나가는 기업에 더욱 관심을 갖기도 하고요. 이러한 사례들이 더욱 많아져 글로벌 시장을 이끌고, 최고의 인재들을 모을 수 있기를 바랍니다.
“수상은 팀원 모두 한마음으로 수행한 깊이 있는 연구 덕분”
논문 관련 회의를 진행하는 개인화모델링팀의 모습
Q. 이번 논문을 진행하게 된 계기는 무엇인가요?
저희 같은 데이터 사이언티스트들은 업무를 진행할 때, 모델의 구조 혹은 알고리즘 등을 잘 정리를 해두는 편이 좋습니다. 논문은 업무와 관련된 내용을 논리적으로 정리를 해놓을 수 있는 도구입니다. 저희 팀의 논문 작업은 2022년부터 꾸준히 진행되고 있습니다.
Q. 논문 작성은 어떤 식으로 진행이 됐나요?
먼저 팀이 해결해야 하는 업무들이 있으니, 그 과제에 대해 먼저 정의를 하고 알고리즘적인 해결법을 논의합니다. 전체적인 아이디어가 그려지면, 타 연구를 바탕으로 팀원 개개인이 선행 연구를 진행합니다. 이후, 논문의 초안을 작성합니다. 초안을 기준으로 모든 팀원이 검토하며 의견을 제시하고, 글을 수정합니다.
Q. 논문을 진행할 때, 팀원의 역할은 어떻게 분담이 되었나요?
모델 구조를 고안하고 개발하는 작업은 모두 함께 진행하고, 기존 선행 연구들에 대한 실험은 각자 나눠 진행했습니다. 한 달 동안은 모두가 모여서 현재 SKT가 가진 여러 종류의 데이터들을 효율적으로 합칠 수 있는 방법과 빠르게 학습할 방법을 열심히 고민했습니다. 고민들을 토대로 모델을 확정한 이후에는 초안을 작성했고, 모두가 지속적으로 논문을 수정하고 보완했습니다.
Q. 논문을 준비하는 과정에서 기억에 남았던 점은 무엇인가요?
저희는 사업 조직에 속해 있기 때문에, 논문을 쓸 수 있는 별도의 시간적인 여유가 많지 않았습니다. 그런데도 팀원들이 한마음으로 모델에 대한 깊이 있는 고민과 선행 연구 구현에 임했고, 그 결과 세계적인 수준의 학회에 제출할 수 있을 만한 논문을 쓸 수 있었습니다. 저희 담당님과 팀장님께서도 이러한 상황 속에서도 논문 작성에 대한 전폭적인 지지를 해주셨고, 더 나아가서는 모델 알고리즘에 대한 고민도 같이 해주셨습니다.
SKT 고객들의 다양한 행동로그를 파악하는 One Model
SIGIR 2024 우수논문상을 수상한 개인화모델링팀. 왼쪽부터 데이터 사이언티스트 윤형준 님, 김태산 님, 박정 님
Q. One Model 버전 2.0과 버전 1.0은 어떤 차이점이 있나요?
추천 성능과 연산 효율성이 향상되었습니다. One Model 버전 1.0은 비교적 적은 수인 10여 개의 도메인 데이터를 이용해서 연산량이 크게 부담스럽지는 않습니다만, 도메인 수가 많아지면 컴퓨팅 효율이 떨어집니다. 앞으로 데이터의 종류가 많아질 것을 대비해, 연산 효율이 좋은 모델이 필요해서 One Model 버전 2.0을 개발하게 된 것입니다. 이 과정에서 기존 LLM에도 많이 쓰이는 mixture-of-expert여러 개의 신경망을 서로 다른 분야에 특화된 전문가 신경망으로 각각 훈련시키고, 이 신경망들을 혼합하여 활용하는 딥러닝 모델 구조 기술을 우리 데이터에 맞게 변형하는 과정을 거쳤습니다.
Q. One Model 버전 2.0의 특장점은 무엇인가요?
추천 성능이 대폭 향상되고, 학습과 추론의 효율성이 매우 좋아졌습니다. 가장 큰 장점은 데이터 도메인 수가 많아지더라도 연산 효율이 떨어지지 않는 것입니다. 이번 수상에서도 이 장점이 큰 점수를 받았습니다.
Q. One Model이 적용되는 SKT 서비스는 무엇인가요?
기존에 버전 1.0이 적용됐던 요금제 추천과 T멤버십 추천에 버전 2.0이 적용되었고, 향후 구독 상품 추천에도 적용될 예정입니다. 에이닷 발화 가이드 추천이나 푸쉬 메시지 대상자 추출에도 사용되어서 사실상 주요 추천 채널에 모두 적용되고 있습니다. One Model 버전이 업그레이드되면 고객은 기존 모델보다 더욱 개인화된 추천을 받아볼 수 있기 때문에, 자신에게 적합한 SKT 서비스를 적시에 받아 볼 수 있습니다. 이는 곧 우리 회사 서비스에 대한 고객 경험 향상으로 이어질 것으로 생각합니다. 실제로 One Model 버전 2.0의 추천은 기존 모델이나 대조군 대비 높은 구매 전환율을 나타내고 있습니다.
Q. One Model과 관련하여 앞으로의 계획은 무엇인가요?
최근 개발된 One Model 버전 3.0이 곧 있을 에이닷 개편의 오퍼링 시스템에 적용될 예정입니다. 기능이 실무적으로 증명되면, 연구로서도 논문으로 검증받을 계획입니다.
SIGIR 2024 우수논문상
SKT는 이번 SIGIR 2024 우수논문상 수상으로 AI 역량을 입증할 수 있었다. SKT는 앞으로도 개인화 기술을 통해 고객만족도를 증진시키고, AI Company로서 AI 기술 발전에 기여할 것이다. 한편, One Model 버전 2.0은 에이닷과 T우주, T딜 등 다양한 서비스에 확대 적용될 예정이다.