한글날을 맞이하여, SKT 자체 AI 언어모델 개발을 이끌었고, 현재는 글로벌 거대언어모델(이하 LLM)을 담담하고 있는 에릭 데이비스(Eric Davis) 부사장으로부터 한국어 및 다국어 LLM 기술 경험과 AI가 가져올 미래에 대해서 이야기를 나눠보았다.
“한글의 과학적 특징에 매료” 한국에 대한 관심이 SKT 자체 AI 언어모델 개발로
Q. 담당하고 있는 업무 소개를 부탁합니다.
제가 담당하고 있는 부문은 Global LLM입니다. 통신사의 데이터를 LLM에 학습시키고, LLM의 다국어 능력을 개선하는 작업을 진행합니다. 이렇게 학습된 LLM으로 앱과 서비스를 업그레이드시키거나 새로운 서비스를 만들 수 있습니다.
Q. 한국에서 일하게 된 계기는 무엇인가요?
언어학 전공 졸업 이후, 한국에서 영어를 가르친 적이 있습니다. 그 과정에서 한글의 과학적 특징에 빠지게 되었습니다. 이후, 한글에 꾸준하게 관심을 가졌고 한국과 미국 애플(Apple)에서 AI 음성 프로그램인 시리(Siri)의 한국어 작업을 담당하였습니다. 2019년에 SKT에 합류하여 자체 LLM 개발을 담당하게 됐죠.
Q. 외국인으로서 SKT에서의 직장생활은 어떤가요?
사실, 최신 기술을 다루는 회사들은 대부분 공통점을 가지고 있습니다. 기술의 발전 속도에 익숙해져야 하고, 많은 업무량과 촉박한 마감 기한을 견뎌야 합니다. 하지만, SKT는 구성원이 일과 삶의 균형을 맞출 수 있도록 노력하는 부분이 많습니다. 그중 하나인 해피프라이데이*는 제가 좋아하는 SKT의 근무제도입니다. 매월 둘째 주와 넷째 주에 직장에서 벗어나 취미를 즐기고 재충전할 수 있죠.
* 해피프라이데이(Happy Friday): 매월 둘째 주/ 넷째 주 금요일에 쉴 수 있는 SKT 근무제도
“AI 언어 모델의 핵심은 고품질 데이터 확보” 언어학자들까지 참여하여 한국어 LLM 구축
Q. SKT 자체 한국어 거대언어모델(LLM)은 어떤 계기로 개발하게 되셨나요?
국내외 회사에서 다국어 언어모델을 개발했던 경력 때문에, SKT에서도 자체 LLM 개발에 참여하게 되었습니다. 한국어 AI 모델 구축 초기 목표는 대규모의 고품질 한국어 데이터 세트를 구축하는 것이었습니다. 모든 LLM의 힘은 데이터에 있습니다. 모든 언어의 문법 규칙과 단어의 뜻은 대부분 데이터에서 학습되기 때문에 고품질 데이터 세트를 확보하는 것이 공통된 가장 중요한 목표입니다. 대규모의 고품질 한국어 데이터 세트를 구축하면 AI 모델은 한국어의 복잡성, 뉘앙스와 패턴을 학습할 수 있습니다.
Q. SKT에서의 한국어 AI 모델 개발 경험은 어땠나요?
좋은 기회였고, 많은 것을 배울 수 있었습니다. 개인적으로는 자랑스러운 커리어 중 하나이고요. 개발을 위한 LSL(Language Superintelligence Labs, 언어 초지능 랩)을 구성하기 위해 각 분야의 전문가들을 한 부서에 모았는데요. 특히 언어학자들까지 합류하여 초기부터 품질 좋은 데이터를 많이 확보할 수 있었습니다. 이는 모델 성능에도 좋은 영향을 끼쳤습니다. 이 경험을 통해 몇 가지 통찰력을 얻었는데, 첫 번째는 LLM 개발 시 모델 크기보다 데이터 품질이나 다양성, 양이 중요하다는 점, 두 번째로는 벤치마킹이 중요하다는 점이었습니다. 개발을 마쳐도 평가 기준이 없으면 과제의 성공 여부를 파악하지 못하는데, 저희 랩은 처음부터 명확한 평가 기준을 설정해, 좋은 모델을 개발할 수 있었습니다. A.(에이닷)의 대화 서비스에도 이 LLM이 적용되었는데, 사용자 만족도 또한 높아서 큰 보람을 느끼기도 했습니다.
Q. 국립국어원과도 협업을 했다고 들었는데, 어떤 업무였나요?
네, 2021년 9월에 국립국어원과 AI 언어 능력 평가 대회를 개최한 적이 있었습니다. 4가지 평가 항목이 있었는데, 문장 적법성 판단, 동형이의어 구별, 인과 관계 추론, 판정 의문문 대응* 등 기존보다 난이도가 높았습니다. 국립국어원과 함께 한국어 AI 모델의 발전과 국어 정보화 확산에 기여하자는 취지에서 진행했었습니다.
* 문장 적법성 판단: 문장 오류 판단, 동형이의어 구별: 문맥에 따라 단어 의미 구별, 판정 의문문: 제시문을 읽고 예, 아니오 판단하기
“초거대언어모델은 산업혁명과 같은 대전환” Global LLM을 전 세계에 선보일 것
Q. 현재 담당하고 계신 SKT의 Global LLM은 어떤 AI 언어 모델인가요?
‘글로벌 텔코* AI 얼라이언스’의 AI 플랫폼의 기반이 될 LLM이며, SKT의 다양한 사업에도 AI 전환을 위해 적용될 것입니다. SKT Global LLM이 구축된다면, 전 세계 최초의 다국어 텔코 전문 LLM이 될 것이라 예상합니다. 물론 해당 분야 최고 수준에 도달하도록 저를 비롯한 모두가 노력할 예정입니다. Global LLM이 확장되면 여러 방면으로 사용할 수 있어, 전 세계적인 AI 발전에 기여할 수 있을 거라 생각합니다.
* 텔코(Telco.): 통신사업자
Q. SKT의 Global LLM의 현재 목표는 어떻게 되나요?
단기 목표는 연말까지 텔코향 LLM을 구축하는 것입니다. 현재 수집하고 있는 다국어 텔코 데이터로 LLM 튜닝을 시작할 예정입니다. 이후에는 사용 용도에 대해 집중할 계획입니다. 동시에 SKT의 AI 콜센터(AICC)에도 적용하기 위해서 준비 중입니다. 텔코향 LLM은 통신사가 보유한 다양한 데이터를 통해서 해당 영역과 사용자의 의도에 대해서 잘 이해할 수 있을 것이며, 범용 LLM에 비해서 실시간 서비스의 대기시간과 비용도 줄여줄 것입니다.좀 더 이후에는 텔코 얼라이언스 참여 사업자들과 함께 통신서비스 운영 효율성 개선을 고민하고, 새로운 비즈니스 모델도 만들어 갈 예정입니다.
Q. 마지막으로 LLM이나 생성형 AI에 대한 관점을 나누어 주실 수 있을까요? 또, 개인적인 목표나 계획이 있다면 들려주세요.
OpenAI의 ChatGPT는 의미 있는 결과물과 직관적인 인터페이스로 모두에게 영감을 주었습니다. 이후 많은 기업이 생성형 AI 시장에 뛰어들었고, 산업혁명에 버금가는 변화의 시작이라는 의견에 저도 동의합니다. 일부 우려도 있지만, 사람과 AI가 협력하여 업무 생산성과 효율성을 더 향상시키는 것이 바람직하다는 생각입니다. 그래서 저는 IA (Intelligence Augmentation, 지능증강)라는 용어를 사용하기도 합니다. 이런 AI 대변화의 시기에 AI 분야에 있다는 것은 매우 흥미로운 일입니다. SKT에서 일하게 되어 기쁘고, 앞으로도 한국에서 살고 일하고 싶습니다. 개인적으로는 SKT의 Global LLM 부문을 지속적으로 성장시키고, 파트너 통신사들과 협력하여, SKT의 기술과 역할을 전 세계로 확장시키고 싶습니다.
현재 SKT의 Global LLM은 ‘앤트로픽(Anthropic)’*등과 협력하며 다국어 LLM 및 통신사 특화형 서비스 개발을 진행하고 있다. 에릭 데이비스는 앞으로 LLM은 SKT의 핵심 기술로서, 다양한 방면에서 만나볼 수 있을 것이라 전했다.
* 앤트로픽(Anthropic) : OpenAI 출신 연구원들이 창업한 미국 생성형 AI 혁신 기업. 앤트로픽의 생성형 AI ‘클로드(Claude)’는 OpenAI의 ChatGPT와 함께 주목받는 대화형 AI 중 하나로 평가된다.