인공지능의 영역: 이제는 인공지능 번역으로 언어 통일 시대에 가까워 지고 있다.

02/13/17

■ 통계 번역 무너뜨린 머신러닝

지난해 말, 국내 최대 포털 네이버와 인공지능 분야 세계적 선두주자 구글은 나란히 인공지능 기반 번역 서비스를 내놓았다. 네이버는 인공신경망 기술을 적용한 새로운 번역 서비스 ‘파파고’를 10월에, 구글은 기존 ‘구글 번역’에 인공신경망 기술을 적용한 완전히 새로운 수준의 번역 서비스를 11월에 출시한 것이다.

우리는 이미 알파고와 이세돌 9단의 바둑 경기를 통해서 인공지능의 불가사의한 힘에 대한 예방접종을 맞은 바 있지만, 구글의 새 번역 서비스는 전세계 트위터 타임라인에서 큰 화제를 몰고 왔다. 구글은 최초의 별도 알림 없이 인공지능 번역을 ‘조용히’ 적용했는데, 어떻게 하룻밤 사이에 번역이 이렇게 좋아질 수 있는지 모두들 놀랐던 것이다. <뉴욕 타임스>는 12월 ‘위대한 인공지능의 각성’이라는 제목의 기사로 이를 집중적으로 다루었다. 일본 도쿄대 정보학과 레키모토 준 교수는 이 신문과 한 인터뷰에서 영어 소설 <위대한 개츠비>를 놓고 소설가 무라카미 하루키 번역본과 구글 번역을 직접 비교한 예를 들며 “작은 부자연스러움”을 빼면 “(구글 번역이) 더 명확했다”고 놀라워했다. 김정균 번역가도 새 구글 번역을 두고 “판도라의 상자가 열렸다”며 두려움에 떨었다.

하지만 인간이 이 수준에 도달하기까지 ‘기계 번역’ 기술의 역사는 60년을 거슬러 올라간다. 1950년대 냉전 초기, 미국의 과학자들은 당시 소련의 말을 컴퓨터로 번역하기 위해 박차를 가하고 있었다. 이들은 번역을 2차 세계대전의 독일군 암호 해독과 비슷하게 여겼다. 러시아어와 영어의 법칙을 풀어 코드를 입력하면 컴퓨터가 러시아어를 영어로 술술 풀어내리라고 생각한 것이다. 이런 믿음은 미 정부의 예산지원과 함께 10년 동안 이어졌지만 결실을 맺지 못했고, 1966년 위원회까지 꾸려 검토에 나선 미국은 이 계획이 성공할 수 없다고 결론 내렸다. 기계 번역은 이후 20년가량 동면을 맞게 된다.

사실 언어의 법칙을 풀겠다는 방식 자체가 이런 실패를 예정하고 있었다. 언어란 복잡 미묘해서 해독 규칙을 많이 입력하면 할수록 결과는 이상해지기 마련이기 때문이다. 인터넷에 나도는 ‘번역기 개그’가 좋은 예다. 동요 ‘짤랑짤랑’을 과거 번역기에 넣고 영어로 번역했다 다시 한글로 번역하면 “으쓱 으쓱~”이 “공포의 떨림과 공포의 떨림과~”로 나오는 식이다. 이런 접근법을 ‘규칙 기반’의 1세대 기계 번역이라 할 수 있다.

기계 번역의 동면을 깨운 것은 아이비엠(IBM)이었다. 1980년대 이 회사 연구진은 통계를 이용하면 번역 품질을 획기적으로 높일 수 있다는 점을 깨달았다. 인간이 번역한 많은 결과를 데이터화하면 통계적으로 어떤 단어 다음에 어떤 단어가 나오는 게 자연스러운지 산출할 수 있다는 것이다. 이것이 ‘통계 기반’의 2세대 기계 번역이다. 2세대의 강자는 프랑스의 시스트란과 미국의 구글이었다(시스트란은 2014년 우리나라 번역업체 씨에스엘아이(CSLi)가 인수했다). 통계가 적중할 확률을 높이려면 많은 데이터 확보가 관건이다. 인터넷 전체를 데이터베이스화해온 구글은 이런 면에서 강했다. 번역 엔진을 만들던 2005년에만 구글이 국제연합(UN)의 문서 등을 통해 확보한 데이터가 2000억 단어를 넘었다. 예전 네이버 번역을 비롯한 다른 대표적인 번역 서비스도 이런 통계 방식을 기반으로 하고 있다.

그리고 3세대 ‘인공신경망 기반 번역’ 시대가 지금 우리 눈앞에 펼쳐지고 있다. 인공신경망 방식도 데이터를 이용한다는 점에서는 통계 방식과 같지만, 방법이 전혀 다르다. 인공신경망은 아기가 시행착오를 겪으면서 무언가를 배우듯이, 우리 뇌의 뉴런을 흉내낸 인공지능 프로그램을 만들고 이 인공지능에게 수많은 한글-영어 번역 데이터를 줘서 스스로 학습하도록 하는 것이다. 이렇게 학습한 인공지능은 이후 새 번역거리를 받으면 가장 자연스럽다고 예측하는 결과를 내놓는다. 이는 알파고 원리와도 같다. 알파고 역시 수많은 바둑 기보로 학습한 뒤 가장 이길 것 같은 자리에 돌을 둔다. 네이버의 파파고도 구글 번역과 원리는 같다.

■ 인공지능 머릿속 들여다보니

바둑처럼 번역에서도 인공지능은 다시 한번 놀라운 능력을 보여줬다. 기계 번역의 품질은 인간 전문가와 비교했을 때 얼마나 비슷한지에 대한 ‘블레우(BLEU) 점수’라는 척도로 평가하는데, <뉴욕 타임스>에 따르면 구글이 자체평가한 인공지능의 점수는 이전 통계 방식 번역기가 보여준 최고 점수 20점대 후반보다 7점이나 앞서는 것이었다. 이 수치는 세계 최고 수준의 구글 개발팀이 지난 10년 동안 올린 점수차를 단숨에 뛰어넘은 것이기도 했다.

구글은 나아가 한 인공지능에게 여러 언어를 학습시키면서 한 번역에서 배운 노하우를 다른 번역에서도 활용할 수 있는지 실험했다. 예를 들어, 인공지능이 한국어↔영어, 일본어↔영어 번역 데이터를 학습하면 한국어↔일본어도 잘 번역하는지 살펴본 것이다. 결과는 ‘그렇다’였다.

더 놀라운 발견은 구글이 인공지능의 머릿속을 단순화하여 이 과정을 그림으로 나타내 봤는데, 한국어, 영어, 일본어 할 것 없이 같은 뜻의 문장은 하나로 묶어 대체로 비슷한 형태로 인식하고 있었다는 점이다. 즉, 각각 다른 언어로 표현되는 말의 개별 형태를 떠나 의미에 기반한 별도의 체계를 인공지능이 형성하고 있다는 것이다. 구글 연구진은 이에 대해 “일종의 ‘보편어’(인터링구아)의 단초를 보여준 중요한 발견”이라고 설명했다.

원래 인터링구아는 국제보조어협회(IALA)라는 과학자 단체가 1937~51년 사이 제2의 만국 공용어로 쓰려고 라틴어를 기반으로 만든 언어를 말한다. 보통 제2외국어는 현재 우리나라의 영어같이 그 시대 지배적인 문화권의 언어가 차지하게 되는데, 해당 문화권의 이익에 따르는 사고방식까지 사용자에게 함께 전파된다. 이런 문제를 보완하고자 인공적으로 만든 언어가 인터링구아다. 구글 연구진이 말하는 인터링구아는 이와 상관없이 인간이 이해할 수 없는 인공지능만의 언어를 말하지만, 인공지능이 여러 언어들에서 의미를 기준으로 공통된 패턴을 추출해 냈다는 것은 이후 보편어 연구에 귀중한 자료가 될 수 있다. 알파고의 바둑 기풍이 인간에게 새로운 영감을 불어넣었듯이 말이다. 구글 연구진은 앞으로 100개 넘는 언어를 이 인공지능에게 가르칠 계획이다.

■ 일베, 넷우익… 갈등 표출될 수도

더글러스 애덤스의 책 <은하수를 여행하는 히치하이커를 위한 안내서>를 보면 ‘바벨 피시’라는 외계생물이 나온다. 신호를 먹고 신호를 배설하는 이 물고기를 귀에 넣으면 통역사 필요 없이 다른 외계인의 말을 바로 알아들을 수 있다. 번역 인공지능은 향후 이런 ‘인터넷의 바벨 피시’가 될 가능성이 높다.

네이버의 파파고 개발을 총괄한 김준석 리더는 <한겨레>와 한 인터뷰에서 “인공신경망의 빠른 발전 속도를 고려하면 3년 뒤에는 매우 매끄러운 번역이 가능하게 될 것”이라며 “일상생활에서 (외국인과의) 의사소통은 번역기를 통해서 충분히 가능한 시대가 올 것”이라고 말했다. 나는 한국어로 말을 하지만 상대방에게는 중국어로 들리고, 상대방의 아랍어가 나에게는 자연스럽게 한국어로 들리는 시대가 머지않아 도래하리라는 말이다.

이런 서비스는 이미 일부 제공되고 있다. 마이크로소프트의 화상 채팅 서비스 ‘스카이프’의 경우 영어-스페인어 등 일부 언어에 한해 이런 자동 통역 기능을 제공한다. 소셜네트워크 페이스북의 경우 영어 등 일부 외국어의 경우 담벼락 글에 ‘번역 보기’ 단추가 달려 있다. 클릭하면 사용자 언어로 번역된다. 파파고나 구글 앱의 경우 간판 등을 스마트폰의 카메라로 찍으면 글자 이미지를 인식해 번역한다. 이런 기술이 안경 형태의 웨어러블 기기나 콘택트렌즈 형태의 기기에 적용된다면 영문 잡지의 글이 우리 눈에는 한글로 보이는 시대가 올 것이다.

이렇게 언어의 장벽이 걷히면 우리는 어떤 시대를 맞이하게 될까? 다시 한 가족이 된 인류는 바벨탑의 전설을 이어갈까? 황용석 건국대 미디어커뮤니케이션학과 교수는 반대로 “더 심한 민족 간 갈등을 겪을 수 있다”고 말한다. “지금까지 민족주의적 정치 행동은 한 나라 안에 머물고 있었다. 예를 들어, 일간베스트(일베) 회원이나 일본 넷우익(인터넷의 극우주의자)들은 각각 한국과 일본의 국내 정치 구도 안에서 활동해왔다. 자국의 외국인이나 진보주의자를 공격했을 뿐이지, 둘이 서로 싸우지는 않았다. 국경 없는 인터넷 시대가 도래한 지 오래인데도 그랬던 이유는 언어라는 장벽 때문이었다. 이 장벽이 사라지면 이들이 직접 맞부딪혀 싸우는 시대가 오게 될 가능성이 크다.”

인터넷 공간에서 민족 간 감정이 격화되는 일은 지금까지 비일비재했다. 2005년 일본 누리꾼들은 독도사랑 캠페인 경력의 한국 연예인 김태희를 공격해 자국 광고모델에서 몰아냈고, 2009년엔 피겨선수 김연아를 상대로 반한 감정이 분출했다. 같은 해 간도협약 100주년으로 한국 누리꾼들의 ‘영토수복’ 게시물이 퍼지자, 중국 누리꾼들의 반한 게시물이 급증했다. 2012년엔 한·일 누리꾼들이 일본군 위안부 문제를 두고 미국 청와대 청원 사이트로 몰려가 ‘청원 전쟁’을 벌이기도 했다. 중국의 사이버 민족주의 연구자 우쉬 박사는 이와 관련해 “과거 소수 엘리트(외교 전문가)에서 일반 대중으로 (민족 간) 문제제기의 주체가 넘어갔다. 또 이를 통해 현실에 영향을 미치려는 인구가 점차 증가하고 있다”고 지적했다. 언어 장벽까지 사라지면 이는 더욱 증폭될 것이다.

실제 사례가 있다. 네이버가 2001년 개시했던 ‘인조이재팬’이다. 이 누리집 일부 게시판에선 한국인이 올린 게시물이 일본인에게는 일본어로, 반대로 일본어 게시물은 한국어로 자동 번역되는 실험적인 서비스가 제공됐다. 그 결과는 대체로 아름답지 못했다. 2003년 ‘청산리 전투’에 관한 한국 누리꾼과 일본 누리꾼 사이 역사 논쟁을 계기로 양쪽 누리꾼들이 본격적인 격돌 양상이 심화되면서 일본 넷우익들이 대거 몰려와 혐한 게시물들이 도배를 이루는 일들이 발생하곤 했다. 험악한 격돌이 뒤따랐다. 네이버는 결국 2009년 “서비스 이용률이 줄었다”는 이유로 이 서비스를 접었다.

물론 안 좋은 일만 있는 것은 아니다. 의사소통이 쉬워지면 상대방에 대한 이해도 높아지기 마련이다. 다양한 문화적 교류와 언어 부담 없는 여행이 늘면 다른 나라에 대한 이해도 넓어질 수 있다. 지배적 언어뿐 아니라 소수 언어의 관점과 정보도 인터넷에 퍼질 기회도 넓어질 것이다. 황 교수는 “원하는 정보를 선별해서 받아들이고 동질적인 이들과만 네트워크를 형성하는 인터넷의 특성상, 언어의 장벽이 사라진다 해서 곧 건강한 교류가 증진되긴 어려울 것이다. 시민 간 충돌 증가를 대비한 국제 중재기구 구성, 다른 문화를 이해하는 세계 시민교육 강화 등의 노력이 앞으로 필요하다”고 말했다.

일부 신학자는 바벨탑 전설을 ‘신의 형벌’이 아니라 ‘문명의 발전’에 대한 이야기로 해석하기도 한다. 바벨은 문명을 상징하고 다양한 언어의 탄생은 그 발전의 결과라는 것이다. 다가올 ‘디지털 바벨탑’의 이야기가 벌로 끝날지, 발전으로 끝날지는 다른 민족과 문화에 대한 이해와 관용의 자세에 달려 있을지 모른다.

글로벌 뉴스

제목	등록	조회	일자
유럽 주요국두 북한 미사일 발사에 대해 강력 경고	글로벌한인	3610	02/13/17
트럼프ㆍ아베 "북한 탄도미사일 발사" 일제히 성토	글로벌한인	3576	02/13/17
이민단속국, 대규모 색출 작전,범죄 경력 없어도 연행	글로벌한인	3516	02/13/17
4월 제막식 목표로 애틀랜타 소녀상 건립 박차	글로벌한인	3633	02/10/17
美북동부 눈폭풍	글로벌한인	3553	02/10/17
캘리포니아 '트럼프와의 전면전' LA·샌프란시스코 등 불법체류 5곳서 178만여명	글로벌한인	3639	02/10/17
배우자·21세 미만 자녀만... 가족 초청 제외하는 이민 법안 상원 추진	글로벌한인	3656	02/09/17
미국에 들어오는 비자 신청자들에게 SNS 비밀번호 요구할 수도 있다.	글로벌한인	3590	02/09/17
홍명기 이사장 300만달러 "나누는 문화 성숙하길"	글로벌한인	3633	02/09/17
박병호 방출 대신 마이너행 예정	글로벌한인	3689	02/08/17
샌프란시스코 '위안부 기림비' 日 반대·방해공작 속 준비 마무리	글로벌한인	3645	02/08/17
‘미국 우선주의’ 덕에 한미동맹 국 순위 하락	글로벌한인	3591	02/08/17
'스노보드 천재' `미국의 자랑`이 된 클로이 김	글로벌한인	3618	02/08/17
'슈퍼볼 영웅' 은 브래디와 뉴잉글랜드	글로벌한인	3763	02/07/17
슈퍼볼에도 울려 퍼진 '반 이민 정책 비판' 우리는 하나	글로벌한인	3986	02/07/17

백신접종 촉구...유럽도 백일해 환자 급증 '비상'
— 05/10/24
유럽 전역에서 유아에게 치명적일 수 있는 백일해 환자가 급증한 것으로 나타났다. 유럽질병관리예방센터(ECDC)는
미국 대학가 반전시위 누적 체포 2천500명
— 05/07/24
미국 전역 대학 캠퍼스에서 친(親)팔레스타인 반전시위가 지속하는 가운데 5일(현지시간) 일부 대학 캠퍼스에서는 경찰이
KAIST, 고혈압 접근법 제시
— 05/03/24
우리 몸에서 소금이 결핍되면 장이 이를 인식해 섭취 욕구가 작동한다는 연구 결과가 나왔다. 한국과학기술원(KA

경제 뉴스

파월 금리 동결 시사에 증시 '들썩'

제롬 파월 미국 연방준비제도(Fed·연준) 의장이 금리동결 가능성을 시사한 가운데 세계 주가지수가 사상 최고치로 치솟
시사 정치

미국 대선 본선 조기점화...6월27일 바이든·트럼프 '맞장 토론'

오는 11월 미국 대선에서 리턴매치를 벌이게 된 조 바이든 대통령과 도널드 트럼프 전 대통령이 이번 대선 레이스가
경제 뉴스

넷플릭스, 미국프로풋볼(NFL) 경기 올해부터 3년간 크리스마스에도 중계

세계 최대 동영상 스트리밍 업체 넷플릭스는 미국에서 가장 인기 있는 스포츠인 미국프로풋볼(NFL) 경기를 올해부터
경제 뉴스

올가을 중국 커넥티드카 관련 규제 발표"…한국 차 업계 촉각

미국 정부는 15일(현지시간) 미국 소비자 정보 유출에 따른 국가안보 우려가 제기된 중국산 커넥티드 차량 관련 규정을
시사 정치

정부, 잇단 주한미군 관련 발언에 트럼프측에 한국 입장 전달

조현동 주미대사는 14일(현지시간) "한미동맹은 미국 대선 결과와 무관하게 제도화된 협력의 연속선상에서 끊임없이 계속

인공지능의 영역: 이제는 인공지능 번역으로 언어 통일 시대에 가까워 지고 있다.

카테고리

백신접종 촉구...유럽도 백일해 환자 급증 '비상'

미국 대학가 반전시위 누적 체포 2천500명

KAIST, 고혈압 접근법 제시

경제 뉴스

파월 금리 동결 시사에 증시 '들썩'

시사 정치

미국 대선 본선 조기점화...6월27일 바이든·트럼프 '맞장 토론'

경제 뉴스

넷플릭스, 미국프로풋볼(NFL) 경기 올해부터 3년간 크리스마스에도 중계

경제 뉴스

올가을 중국 커넥티드카 관련 규제 발표"…한국 차 업계 촉각

시사 정치

정부, 잇단 주한미군 관련 발언에 트럼프측에 한국 입장 전달

글로벌 한인연대

메뉴

패밀리 사이트

문의하기

글로벌 뉴스

카테고리

경제 뉴스

시사 정치

경제 뉴스

경제 뉴스

시사 정치

글로벌 한인연대

메뉴

패밀리 사이트

문의하기

앱 다운로드