Skip to the content
AI

[을지피플] 나의 대화 친구 A.(에이닷)! 한국어 선생님은 누굴까?

추천 콘텐츠

에이닷, 을지피플, AI, GPT3, GLM, 개발자

SK텔레콤은 8월 2일, 자사 유튜브 채널의 ‘을지피플 시즌2 공조자들’ 코너를 통해 A.(에이닷)의 AI 언어 모델인 ‘GLM’을 개발한 개발자 인터뷰를 공개했다. 앞서 6월 말에 공개한 디자이너 인터뷰 편에 이은 A. 특집으로, A.이 사람과 대화하고 답을 잘 할 수 있도록 만든 GLM팀 3인을 통해 개발 비하인드 스토리를 들어본다.

A.에 적용된 AI 언어 모델 ‘GLM’은 뭘까?

A.은 SKT가 선보인 성장형 AI 서비스다. A. 앱을 실행하면 귀여운 캐릭터가 나에게 먼저 말을 걸어주고 친구처럼 자연스러운 대화가 가능하다. 캐릭터와 이렇게 대화가 가능한 이유는 A.은 GLM(General-purpose Language Model)이라는 GPT-3 기반의 한국어 범용 언어 모델을 사용하기 때문이다.

에이닷, 을지피플, AI, GPT3, GLM, 개발자

A. 메인 화면. 앱을 실행할 때마다 A. 캐릭터가 매번 다르게 질문한다

GLM은 A. 캐릭터가 자연스러운 문장을 생성하고, 감정을 기반으로 한 자유 대화, 폭넓은 지식 대화를 가능하게 만든다. A.에게 “신나는 음악 들려 줄래?”라고 물어보면, “마음에 들만한 신나는 음악을 찾아봤어요. 바로 들려 줄게요”라고 답하며 내 취향에 맞는 신나는 음악을 재생해 준다.

“에이닷의 한국어 선생님” 홍석영 님

에이닷, 을지피플, AI, GPT3, GLM, 개발자

SKT의 GLM팀에는 유일한 비개발자이자 문과생 출신 다섯 명이 있다. 이들 모두 국어국문학이나 언어학을 전공했다. 빅테크 기업에 그것도 AI를 다루는 팀에 언어학 전공자라니 생소하게 느껴질 수 있다. SKT에서는 이들을 링귀스트(Linguist) 즉, 언어학자로 부른다. 홍석영 님도 언어학자다.

왜 언어학자가 필요할까? GLM은 언어 모델을 활용한 기술이다. 기계에게 언어(한국어)를 잘 가르쳐야 하는 것이다. 홍석영 님은 기계가 사람들의 말을 이해하고, 답을 잘 할 수 있도록 언어 모델의 학습에 필요한 한국어 데이터 수급 및 설계, 분석 등을 담당한다.

홍석영 님은 “다양한 배경을 가진 사람들의 주제와 상황 대화를 다룰 수 있도록 노력했다. 그 안에서 최대한 편향되지 않은 데이터를 학습시켰다. 신조어나 유행어 등도 모니터링해 수집하고, 다양한 상황들을 가정해 대화 데이터를 생성했다”고 학습 과정을 설명했다. 홍석영 님은 데이터 안정성(data safety)에도 심혈을 기울였다. A.이 편향/욕설/정치/젠더 이슈 등에 한쪽으로 치우치지 않고 공정하게 답변할 수 있도록 데이터를 설계했다.

홍석영 님은 “앞으로 확장될 A.의 페르소나를 사용자의 대화 속에 잘 녹여낼 수 있도록 준비하고 있다. 또한 사용자와 A.이 보다 깊은 대화를 할 수 있도록 고민하고 연구하고 있다”고 향후 계획을 전했다.

“에이닷의 뇌를 만들다” 김진 님

에이닷, 을지피플, AI, GPT3, GLM, 개발자

GLM 모델링팀에서 근무하고 있는 김진 님은 A.의 지능 지수를 책임지고 있다. 뇌 기능을 이상 없게 하고, A.이 학습을 잘 할 수 있도록 자료를 넣어주는 역할을 한다. 앞서 홍석영 님이 문제집이라면, 김진 님은 학습 방법을 만드는 사람이다. 언어학자들이 학습 데이터를 수집해서 전달하면 GLM 모델링팀이 모델을 학습시켜 A.이 어떤 답을 할지 결정하는 로직을 짠다.

GLM은 한국어 범용 언어 모델이라 구조는 비슷하다. 단, 어떤 데이터로 학습했느냐에 따라 성능이 달라진다. 김진 님은 “인터넷 데이터, SK텔레콤만의 수집 데이터, 직접 구축한 데이터 등을 활용했다. 특히, 직접 구축한 데이터는 다른 기업에서는 찾을 수 없는 양질의 데이터로 구성되어 있다”고 말했다. SKT가 만든 GLM은 소설을 쓰는 것도 가능하다. 김진 님은 “예를 들어, 해리포터 시리즈를 학습시키고 다음에 이어지는 문장을 넣어달라고 하면 그럴싸한 문장을 만들어낸다. 단, 개별 문장은 말이 되는데 재미있는 소설이 되지는 않아 공개하지 못했다. A.의 잠재력을 기대해달라”고 말했다.

A.은 현재 개인화가 되어 있지 않다. 대화 상대에 상관없이 똑같이 반응한다. SKT는 다양한 고객의 유형에 맞춰 개인화 데이터를 제작하고, 이렇게 만든 데이터를 바탕으로 개인화 모델을 학습시킬 계획이다. 김진 님은 “고객이 말했던 대화를 A.이 기억했다가 맞춤형으로 대답하게 만드는 것이 목표다”라고 밝혔다.

“에이닷을 케어하고 안전을 담당한다” 문한솔 님

에이닷, 을지피플, AI, GPT3, GLM, 개발자

GLM 플랫폼팀에서 근무하고 있는 문한솔 님은 A.을 케어하는 역할을 하고 있다. 컨트롤 서버를 담당하며 서버 개선과 서비스 에러가 나지 않도록 모니터링을 한다. 사용자가 A.에게 요청하는 모든 발화가 컨트롤 서버를 거쳐간다. 컨트롤 서버는 A.을 호출하고 사용하는 서버이면서 사용한 데이터를 활용해 A.을 개선하는 역할도 한다. A.에 들어온 데이터를 모아서 발전할 수 있도록 학습 데이터를 모아 주기 때문에 GLM 모델링팀을 보조한다.

문한솔 님은 “오픈 이후, 매일 호출 횟수를 정리해서 아침마다 알림으로 받아보고 있는데 조금씩 사용 수가 늘어나는 것을 보고 매일 뿌듯해하고 있다”고 말했다. 또한 “진정한 선생님은 사용자 여러분이니 많이 사용해 주시고, A.이 좋은 답변을 하면 ‘엄지 척’을, 별로인 답변을 하면 ‘엄지 다운’을 해달라”고 답했다.

A.은 사용자 피드백으로 더 빠르고, 더 좋은 방향으로 발전할 수 있다. SKT는 A.에 ‘A. tv’, ‘A. 게임’ 등 새로운 서비스를 추가하고, 서비스를 대폭 업데이트한 안드로이드 버전을 27일 공개했다. A. tv는 시청 이력과 선호도 기반으로 추천 채널을 구성해 맞춤 콘텐츠를 보여주는 영상 서비스다. 광고 없이 무료 시청 가능하고 다운로드도 가능하다. 26가지 하이퍼 캐주얼 게임을 제공하는 A. 게임도 광고 없이 즐길 수 있고, 플레이에 대한 리워드로 A. 캐릭터를 꾸밀 수 있는 포인트(콘)를 받을 수 있다. 일상의 디지털 메이트 A.과 함께 즐거운 모바일 생활을 즐겨보는 것 어떨까?

을지피플 시즌2 공조자들 개발자 인터뷰 풀버전은 아래 영상에서 확인할 수 있다.

콘텐츠 사용 안내
이 콘텐츠는 공유, 인용, 배포가 가능하며
사용 시에는 ‘SK텔레콤 뉴스룸’으로
출처 표기를 부탁드립니다.

문의하기

콘텐츠 사용 안내
콘텐츠 사용 시에는 SK텔레콤 뉴스룸 출처 표기를 부탁드립니다.
카카오 채널 안내
SK텔레콤 뉴스룸 채널을 추가해 보세요.
추가하기

이 콘텐츠가 SK텔레콤을 이해하는데 얼마나 도움이 되었나요?

답변 선택하기