2016년 미국 대통령 선거 당시 ‘교황이 도널드 트럼프를 지지한다’, ‘힐러리가 IS에 무기를 팔았다’ 등의 사실 확인이 되지 않은 가짜뉴스(Fake News)가 SNS를 타고 빠르게 퍼졌습니다. 온라인 뉴스 매체 버즈피드(BuzzFeed)에 따르면 미국 대통령 선거일 전 3개월간 가짜뉴스의 페이스북 공유, 댓글 등의 반응 건수는 총 871만 건으로, 주류 언론 뉴스의 반응 건수인 737만 건보다 많았다고 합니다. 당시 옥스퍼드 사전은 2016년 올해의 단어로 ‘탈진실(post-truth)’을 선정했습니다. 객관적 사실보다 감정과 개인적 신념으로 호소하는 여론이 영향을 더 미친다는 뜻입니다. 가짜뉴스는 탈진실이라는 키워드를 타고 전 세계적으로 확산되고 있습니다. 우리나라에서도 지난 19대 대선 당시 가짜뉴스가 18대 대선 대비 5배 이상 늘었다고 합니다.
그렇다면 가짜뉴스를 판별하여 사전에 차단할 방법은 없을까요? 물론 가능합니다. 하루가 다르게 발전하고 있는 인공지능 기술을 통해 가짜뉴스를 판별할 수 있습니다. 이미 페이스북과 구글, 네이버 등 뉴스에 대한 영향력이 큰 플랫폼들은 관련 기업을 인수하는 등 다양한 방법으로 인공지능 기술을 연구하고 있습니다. 하지만 이는 가짜뉴스를 걸러 팩트체크가 된 진짜뉴스만을 남기겠다는 전략으로 본질적인 방법은 아닙니다. 팩트체크가 완료될 때까지 기다릴 수도 없고, 이미 읽었던 기사가 나중에 가짜뉴스임을 일일이 확인하기도 어렵기 때문입니다. 사실에 기반한 기사만 쓸 수 있는 기자들, 또는 그러한 언론 매체는 없을까요?
사실에 기반한 기사의 등장, 로봇 저널리즘
그 대안으로 주목받고 있는 것이 바로 로봇 저널리즘(Robot Journalism)입니다. 로봇 저널리즘은 로봇으로 대변되는 컴퓨터 소프트웨어가 데이터를 수집하여 기사 형태의 글을 작성하는 방식입니다. 낯설게 느껴질 수 있지만 LA타임즈, 로이터, AP통신, 파이낸셜뉴스 등 다양한 국내외 언론에서 이미 로봇 저널리즘으로 속보, 날씨, 스포츠, 주식 등의 다양한 분야로 기사를 배포 중입니다.
그렇다면 로봇 기자들은 어떠한 과정을 거쳐 기사를 작성할까요? 사실 사람들이 작성하는 기사, 기자들의 원칙과 별반 다르지 않습니다. 다양한 팩트를 바탕으로 원칙에 기반한 기사를 작성하는 것이지요. 문제는 일부 기자들이 이러한 원칙을 지키지 않는다는 것이지요.
로봇 저널리즘의 기사 작성 방법은 크게 4단계로 나눌 수 있습니다. 첫 번째는 데이터 수집 단계입니다. 기사를 쓰는 대상에 대한 분석 데이터를 모으는 단계입니다. 두 번째는 가치 판단의 단계로 수집한 데이터에서 의미 있는 이벤트를 판별합니다. 그리고 세 번째는 구성 선택 단계입니다. 기사의 내용을 어떠한 관점으로 풀어갈지를 결정합니다. 마지막은 기사 작성 단계로 준비된 틀에 세부 정보를 넣어 문장을 만들고 이를 배열하여 마무리합니다. 로봇 저널리즘 기반의 야구 기사가 작성된다면 아마도 아래의 단계를 거쳐 작성될 것입니다.
.tg {border-collapse:collapse;border-spacing:0;}
.tg td{font-family:Arial, sans-serif;font-size:14px;padding:10px 20px;border-style:solid;border-width:1px;overflow:hidden;word-break:normal;border-color:black;}
.tg th{font-family:Arial, sans-serif;font-size:14px;font-weight:normal;padding:10px 20px;border-style:solid;border-width:1px;overflow:hidden;word-break:normal;border-color:black;}
.tg .tg-cpu2{border-color:#000000;vertical-align:top}
@media screen and (max-width: 767px) {.tg {width: auto !important;}.tg col {width: auto !important;}.tg-wrap {overflow-x: auto;-webkit-overflow-scrolling: touch;}}
1. 데이터 수집: 경기 일자, 팀명, 스코어, 이닝별 진행 상황 등
2. 가치 판단: 삼진, 홈런, 득점 등 중요 상황 선별, 순위 등 3. 구성 선택: 중립 관점, 홈팀관점, 원정팀 관점 등 4. 기사 작성: 문장 작성 및 배열 (작성 기사 예시) |
실제로 KBO는 2군 리그인 ‘KBO 퓨처스리그’에 로봇 기자를 도입하여 경기 결과를 기사로 발행하고 있습니다. KBO의 남정연 홍보팀장은 “현재 미디어 환경에서 2군은 취재하는 매체가 없다 보니 기사가 거의 나오지 않고 있다”며 “KBO가 단순 수치를 보여주기보다는 기사 형태로 제공하는 것이 향후 퓨처스리그에 대한 팬들의 관심을 더 끌 수 있을 것”이라며 로봇 기자를 도입한 이유에 관해 설명했습니다.
축구에서도 로봇 저널리즘이 도입되어 활용되고 있습니다. 연합뉴스는 2017년에 프리미어리그를 담당하는 ‘사커봇’을 통해 로봇 기자를 선보였습니다. 사커봇은 프리미어리그 2017~2018시즌의 380경기 전체의 기사를 작성했습니다. 경기 종료 후 기사를 작성하고 웹사이트에 배포하기까지 걸린 시간은 불과 1~2초 정도였다고 합니다. 이처럼 로봇 저널리즘은 객관적인 데이터가 쌓이는 스포츠 분야에 매우 적합하다고 볼 수 있습니다.
로봇 기자는 주식 관련 분야에서도 맹활약을 펼치고 있습니다. 주식 분야 로봇 저널리즘의 대표적인 사례로 증권정보제공 업체인 씽크풀이 제공하는 라씨(RASSI: Robot Assembly System on Stock Investment)가 있습니다. 라씨는 원래 주식 종목을 실시간으로 분석하여 투자 정보를 제공하는 로보 어드바이저(Robot Advisor) 서비스입니다. 여기에 기사를 작성하는 엔진을 더하여 주식 시장의 시황, 업종, 실적 등을 분석한 로봇 기사를 작성합니다. 라씨는 텍스트 기반의 기사뿐만 아니라 과거의 실적과 경쟁 업체 등을 비교 분석하여 이미지와 함께 기사를 작성합니다.
▲ 라씨는 표나 그래프, 이미지 등을 포함한 다양한 형태의 기사를 배포하고 있습니다.
씽크풀은 파이낸셜뉴스, 전자신문 등 5개의 언론사와 제휴하여 로봇 저널리즘 기반의 기사를 제공하고 있습니다. 씽크풀 외에도 두나무 카카오증권의 뉴스봇, 서울경제의 서경뉴스봇 등의 로봇 기자들이 활동하고 있습니다.
로봇 저널리즘의 한계, 그리고 기대
로봇 저널리즘은 객관적인 사실에 따라서 빠른 기사를 작성할 수 있는 대안 중 하나입니다. 하지만 아직 로봇 저널리즘에도 한계는 있습니다. 로봇 기사는 객관적인 사실을 빠르게 전달할 수 있다는 점에서 사람이 직접 작성하는 기사보다 편리합니다. 하지만 그 객관적인 사실을 로봇 기반의 알고리즘이 직접 판단할 수 없다는 단점이 있습니다.
예를 들어 올해 5월 고속도로 위에서 의식을 잃고 주행 중이던 운전자의 차량을 멈추기 위해 뒤따르던 운전자가 고의로 교통사고를 낸 일이 있었습니다. 더 큰 사고를 막기 위해 문제의 차량을 앞질러 막는 사고를 낸 것입니다. 사실에 기반하자면 이는 사건사고입니다. 하지만 진실에 입각하자면 이 운전자는 오히려 큰 사고를 막았다며 온라인에서는 ‘의인’이라는 칭호로 불렸고, 인천지방경찰청에서는 표창까지 수여했습니다. 이러한 데이터가 직접 수집되지 않는다면 컴퓨터 소프트웨어는 숨겨진 진실을 파악할 수 없습니다. 이것이 현재의 로봇 저널리즘의 단점입니다. 하지만 AI가 지속적으로 발전하고 있다는 사실을 주목할 필요가 있습니다.
2018년 5월 구글은 개발자 콘퍼런스인 구글 I/O(Google Input Output)에서 인공지능 비서인 듀플렉스(Duplex)를 시연하며 놀라운 결과를 보여줬습니다. 듀플렉스가 미용실, 식당 예약을 전화로 성공한 것입니다. 마치 사람처럼 맥락을 인식하고 자연스러운 표현을 구사하며 기존과는 다른 인공지능이 시작됨을 보여줬습니다. 만약 이런 인공지능 엔진이 로봇 저널리즘과 결합한다면, 좀 더 다양한 분야에서 객관적이고 빠른 기사들이 작성될 것입니다. 마치 우리가 초등학교, 중학교, 고등학교, 대학교를 거치며 학습하듯이, 로봇 저널리즘 또한 인공지능을 통해 스스로 학습하며 성장할 것입니다. 지금의 로봇 저널리즘은 초등학교 수준입니다. 점차 성장하며 데이터를 직접 탐색하고 가짜를 판별하여 성인 레벨의 뉴스를 생산해 나갈 것으로 기대해봅니다.
글. 케이(커넥팅랩)