ai.x 2021 컨퍼런스에서 인사말을 하는 SKT 김윤 CTO
SK텔레콤은 9월 15~16일 양일간 ai.x2021 컨퍼런스를 열고, 인공지능(AI) 전문가들과 AI 산업 전반을 심도 있게 논의했다. 첫날에는 ‘AI For Everyone(모두를 위한 AI)’을 주제로 산업 전망 및 AI 모델·인프라·데이터에 관해 견해를 나눴다. 개막 세션에서는 주요 AI 분야 스타트업 대표가 모여 AI 모델·산업의 현주소와 미래, 당면 과제를 분석하는 시간을 가졌다. 이 자리에서 대표들은 “AI 산업은 현재 터지기 직전”이라며 “기회를 얻고자 한다면 행동이 필요한 시점”이라고 입을 모았다.
끓는점 도달한 AI, 3년 이내 폭발해
개막 세션은 ‘Fireside Chat : AI Frontiers’를 주제로 열렸다. B팩토리 노정석 대표가 사회를 맡았고, 스캐터랩 김종윤 대표, 네오사피엔스 김태수 대표, 보이저엑스 남세동 대표, 튜닙 박규병 대표가 패널로 참석했다. 이날 참가자들은 AI 산업의 현주소를 ‘개척지와 미개척지의 경계인 프런티어’로 정의하고, AI 산업의 영향력을 분석했다.
Q. AI는 현재 어느 지점에 와 있다고 생각합니까?
남세동 대표: 과거 웹으로 보면 브라우저 넷스케이프(Netscape)나 검색 포털 야후(Yahoo)가 나오기 직전입니다. 모바일로 보면 카카오톡이 나오기 전과 같다고 봅니다. 즉 터지기 직전이란 말이죠. AI 분야에서 비즈니스를 하고자 한다면 행동이 필요한 시점이 되었습니다. 시간 한도는 계속해서 줄어 들고 있습니다. 분명 2~3년 이내에 큰 변화가 시작될 것입니다.
김종윤 대표: 이런 시기에는 그냥 도전하는 것이 정답입니다. 모바일 시대의 경우 모두가 성공하지는 않았지만, 초기에 앱을 만들고 출시하고 투자해 본 이들이 훗날 성공을 거뒀습니다. 지금은 모바일 시대 초기와 같습니다. 직업도, 창업도, 투자도 AI 관련해서 도전해야 성공할 수 있습니다.
왼쪽부터 박규병 대표, 남세동 대표, 김태수 대표, 김종윤 대표, 노정석 대표
Q. 앞으로 10년 뒤 AI 발전과 사회를 예측한다면?
김종윤 대표: 현재 글로벌 톱(TOP) 20 기업을 살펴보면, AI 기업이 없습니다. 있다고 해도 AI가 주요 사업이 아니죠. 10년 후에는 톱 20 중 15곳이 AI를 주요 사업으로 하고 있을 것입니다.
김태수 대표: 대중적인 검색에 범용 인공지능(Artificial General Intelligence, AGI)이 적용될 것으로 예상합니다. 인공지능 검색은 정보와 정보를 조합해 새로운 정보를 보여줍니다. 예컨대 “A와 비슷한 B를 찾아줘”란 질문에 답을 제시해 주는 것입니다. 10년 뒤에는 AGI를 통해 이런 검색을 할 수 있지 않을까 싶습니다. 넥스트 구글이 나올지도 모를 일입니다.
박규병 대표: 자율주행 자동차, 휴머노이드 등 주류 기술이 더욱더 일상으로 다가와 있을 것입니다. 영화 ‘Her’에는 AI 비서 사만다가 등장하죠. 영화만큼 고도화한 형태는 아니어도, 초기 버전 정도는 우리 곁에 존재할 것으로 생각합니다.
남세동 대표: 10년 뒤에는 AI 기반의 작가나 과학자가 나올 것으로 봅니다. ‘AI 작가 · 과학자에게 노벨상을 주느냐, 마느냐’의 논쟁도 분명 일어날 것입니다.
스타트업도 도전할 수 있지만, 당면 과제도 많아
“지나가는 사람을 보면 딥러닝 하라고 전단지를 돌리고 싶은 심정입니다” – 김종윤 대표
장밋빛 전망에 많은 사람이 AI 시장에 뛰어들고 있기도 하다. 하지만 당면한 과제도 많다. 그중 하나가 GPT-3(Generative Pre-trained Transformer 3)와 같은 빅 모델(초대형 AI 모델) 개발이다.
GPT는 openAI가 만든 3세대 언어 예측 모델이다. 딥러닝을 이용해 인간다운 텍스트를 만들어낸다. 예컨대 문학 작품의 작가를 묻는 말에 능숙하게 답하고, 창의적 제목도 짓는다. 프로그래밍 코드 또한 작성한다. ‘현존하는 가장 흥미로운 AI 시스템’으로 평가받지만, 구축하는 데 들어간 시간·비용이 만만치 않다. 때문에 ‘스타트업이 빅 모델을 개발할 수 있느냐’는 업계의 주요한 화두다.
Q. 스타트업 입장에서 바라보는 빅 모델(초대형 AI 모델)이란?
남세동 대표: 스타트업이 초대형 AI 모델을 독자 개발한다는 것은 사실상 어렵습니다. 스타트업은 빅 모델 기반의 서비스를 만들면 됩니다. 현재도 운영체제(OS), 검색, 클라우드 등 인프라는 대기업이 구축했습니다. 그 위에서 배달의 민족이 나왔고, 토스가 나왔죠. AI 또한 이 구조와 비슷하게 흘러갈 것입니다.
박규병 대표: 가장 현실적인 방법은 기술과 인력을 갖춘 스타트업과 자본과 의지를 갖춘 대기업이 만나 컨소시엄을 결성하는 것입니다.
김종윤 대표: 스타트업도 최신 기술의 70~80% 정도는 따라잡을 수 있다고 판단합니다. AI·딥러닝은 갈수록 적용 범위가 늘고 있고, 사업 아이템도 훨씬 다양해지고 있습니다. 70~80%의 기술로도 해낼 수 있는 일이 무궁무진합니다. 때문에 저는 빅 모델 개발만이 전부는 아니라고 생각합니다.
Q. AGI에 더 가까워지기 위해 필요한 것은?
박규병 대표: 많은 사람이 GPT-3의 후속으로 멀티 모달리티(Multi-modality)를 생각합니다. 텍스트, 이미지, 비디오를 포괄하여 지식을 습득하는 모델입니다. 사람은 책을 보고 비디오를 보고 행동하며 많은 것을 배우죠. GPT 역시 다양한 방법으로 지식을 습득하고, 업데이트하는 시기가 올 것입니다. 이 시기엔 인간 이상의 AI 개체가 탄생할 것으로 봅니다.
Q. AI 스타트업을 운영함에 있어 또 다른 어려움은?
김종윤 대표: 규제의 불확실성입니다. 대부분 사회 체계나 규제가 기존 소프트웨어에 맞춰 정해진 탓에 AI 기업은 기준을 맞추기 어렵습니다. 예를 들어, 기존 개인정보 가명·익명화 체계는 정형 데이터 기준으로 잡혔습니다. 비정형 데이터에서 개인정보를 가명·익명화할 경우 기준을 어떻게 잡아야 할지 정해진 바 없습니다. 많은 AI 스타트업이 이런 문제에 맞닥뜨릴 것입니다. 회사 내부적으로 대응 논리를 마련하고, 내부 원칙을 설명할 수 있는 준비를 해 두라고 조언하고 싶습니다.
채용 또한 AI 스타트업이 겪는 어려움입니다. 아직 인력이 충분하지 않기에 채용 전쟁이란 말이 실감 날 정도입니다.
그럼에도 AI는 기회의 땅
아직 산재한 어려움이 많지만, 스타트업 대표들은 주저 없이 뛰어들라 말한다. 분야를 막론하고 AI 산업에 도전해야 기회를 가질 수 있다는 이유에서다.
Q. AI·딥러닝의 중요성을 대중의 언어로 이야기한다면?
김종윤 대표: AI는 앞으로 인터넷이나 스마트폰보다 훨씬 더 큰 변화와 가치를 만들 것입니다. 엔지니어가 아니더라도 이해와 관심이 필요합니다. 특정 연구 결과를 이해할 정도까지 소양을 갖추면 어떤 방식으로든 도움이 될 것입니다.
김태수 대표: 초창기에는 엔지니어 중심으로 돌아가겠지만, 세월이 지나면 다양한 부문에서 인력이 필요할 것입니다. AI 전문가를 포함해 HR이나 홍보 인력도 포함됩니다. 잘 모르더라도 관심 갖고 일하다 보면, 이 분야에서 높은 위치를 차지하는 등 기회를 가질 수 있다고 봅니다.
남세동 대표: 앞으로는 AI를 모르면 사는 데 어려움이 있을 것입니다. “모두 엔지니어가 되어라”는 말은 아닙니다. 엔지니어가 아니어도 다양한 분야에서 AI를 활용하게 될 겁니다. 컴퓨터, 인터넷 시대에 맞춰 관련 법조인이 생기고, 방송인이 생기는 것처럼 말이죠. AI 시대에 맞춰 우리 일들이 하나하나 바뀌어 나갈 것입니다.
AI 산업에 관한 논의는 16일에도 계속된다. 16일에는 ‘AI for X’라는 소주제로 의료·보안에서의 AI 기술 및 AI 사례가 공유된다. ‘소비더머니’ 조현용 기자를 비롯해 SKT·삼성서울병원·DHP·지니너스·ADT캡스·이노뎁 등 다양한 기업 인사가 참석해 정보를 나눌 예정이다. ai.x 컨퍼런스 2021은 16일 18시 이후 공식 홈페이지에서 다시 볼 수 있다[바로가기].
참고자료. AI의 핵심인 데이터 “품질 확보하려면…”
왼쪽부터 김경환 매니저, 조남규 매니저, 이선우 매니저, 조민구 매니저
ai.x2021 컨퍼런스 첫 날에는 AI 개발의 기초인 ‘데이터’에 관한 실무자 논의도 진행됐다. SKT T3K 김경환(교통 데이터), 이선우(언어 데이터), 조남규(의료 데이터) 매니저가 참석, 데이터 수집부터 품질 확보까지 다양한 노하우를 공개했다.
이선우 매니저는 “오픈 데이터를 수집하지만, 양이 충분하지 않기에 사내 데이터·강의·보고서 등 다양한 문서를 활용한다”라며 “필요한 경우에는 대화를 직접 생성하기도 한다”고 밝혔다.
데이터 품질 확보 방법은 분야에 따라 다르다. 이선우 매니저는 데이터 활용 전 과정에서 품질 확보에 힘쓴다. 개인정보나 혐오 표현이 곳곳에 숨어 있기에 꼼꼼히 검수해야만 품질을 확보할 수 있어서다. 자동화 검수 방법 외에도 언어 전문가의 검수까지 병행하고 있다.
김경환 매니저는 자사 데이터와 외부 데이터를 비교·대조해 데이터 신뢰도를 높인다. 김 매니저는 “데이터가 차이가 발생했다면 수집과 정제 과정에서 문제가 있었다 판단하고, 협력사와 함께 수정해 품질을 높인다”고 말했다.
이날 토론에서는 품질 좋은 데이터를 위한 개선점에 관해서도 의미 있는 이야기가 오갔다. 조남규 매니저는 “깨끗한 데이터를 한 번 확보했다고 해서 양질의 데이터를 얻었다고 할 수 없다”며 “언어를 예로 들면, 오늘은 완벽한 데이터라도 훗날 혐오 표현이 될 수 있다”고 언급했다. 또한, “이런 부분을 고려하면서 데이터를 수집·정제해야 한다”고 조언했다.