IT/인공지능 / / 2023. 4. 30.

[인공지능] 게임 '발번역'은 왜 나오는 걸까?

728x90
728x90

* 전문적인 분석 글이 아니라, 제 생각을 주저리주저리 나열한 글입니다.

1. 게임 발번역은 왜 생기는 걸까?


 

어쩌다 '발번역'이 나오는 걸까?

대한민국 게임 시장이 꽤 커졌다. 단순 비유적인 표현이 아니라, 실제로 소비 규모가 상당히 커졌으며, 편중되었던 소비 패턴도 꽤나 평준화되었다. 여전히 모바일이 강세를 보이지만, 이제 게

www.inven.co.kr

 

네이버 뉴스에 구독 눌러둔 언론사가 총 다섯 개이고, 그중 한 곳이 게임 커뮤니티 인벤(inven)이다. 그리고 얼마 전 인벤의 최신 기사 목록을 보다 우연히 정지훈 기자님의 기사를 접했다. 주제는 게임을 다른 나라 언어로 서비스할 때, 전문 번역가를 통해 번역을 맡기는 데도 왜 발번역이 나오는가. 인공지능을 활용해 게임 채팅 번역을 연구하는 입장에서 기사의 주제와 내용이 매우 흥미로웠다.

 

2. 자연스러운 번역에는 문맥과 지식이 필요하다.


영어와 게임, 결국 이거죠. 영어를 모르면 일을 못하고, 마찬가지로 게임을 몰라도 일을 못해요.

출처 : 어쩌다 '발번역'이 나오는 걸까 (https://www.inven.co.kr/webzine/news/?news=283861)

 

그렇다. 영한 번역을 예로 들었을 때, 번역은 단순히 영어를 잘한다고 해서 자연스럽게 할 수 있는 게 아니다. 내가 금융 분야의 번역 의뢰를 맡는다면, 전문적인 금융 지식이 바탕이 돼야 알맞은 표현으로 번역할 수 있을 것이다. 그리고 그렇게 해야만 정보를 올바르게 전달할 수 있다. 이건 게임도 마찬가지다. 따라서 게임 지식이 부족하면 아무리 영어를 잘하더라도 게임 번역을 완벽하게 수행하기 어렵다.

 

정향 대표가 말했다. 대표적인 발번역 사례 중 하나인 '워크래프트3'의 "누구? 저요?"의 경우 화자가 누군지를 전달받지 못했을 거라 말했다. 번역 씬에서 자주 일어나는 문제인데, 스트링 넘버나 화자를 모르는 상태로 대사만 보고 번역을 해야 하는 일이 상당히 자주 일어난다. 보통 이럴 때는 앞 뒤 번역문을 전부 다 보면서 맥락을 짚으려 하지만 그마저도 어려운 상황이면 그냥 가장 무난한 '요'체로 번역하게 된다.

출처 : 어쩌다 '발번역'이 나오는 걸까 (https://www.inven.co.kr/webzine/news/?news=283861)
'아이템 발견'의 Found가 '설립'으로 번역되거나, 15% 할인의 'Off'가 '끄다'로 번역되는 경우 역시 비슷한 예라 할 수 있다. 맥락 없이 그냥 저 단어만 번역해 달라고 오는 경우엔 가장 그럴싸한, 혹은 자주 쓰이는 단어로 번역할 수밖에 없는데, 그대로 넣으면 '아이템 설립'과 '15% 끄다'가 되어버린다.

출처 : 
어쩌다 '발번역'이 나오는 걸까 (https://www.inven.co.kr/webzine/news/?news=283861)

 

무엇보다 말은 맥락에 따라 그 의미가 달라질 수 있다. 이 맥락은 단순히 텍스트 문맥일 수도 있지만, 어떤 이벤트가 발생한 실제 상황의 맥락일 수 있다. 어떤 문장에서, 그리고 어떤 상황에서 나온 말이냐에 따라 자연스러운 번역 결과는 달라진다는 이야기다. 따라서 당연히 이런 정보를 고려해서 번역하는 게 이상적인 결과겠지만, 상황에 따라 그것이 어려울 때가 있다. 아니, 엄밀히 따지면 번역을 할 때 그런 맥락을 고려하기 어려운 경우가 대부분이다.

 

기사에서 언급된 예시로, 어떤 게임의 현지화가 이뤄지는 시점은 게임 출시를 두세 달 앞둔 상황일 때가 있다. 이 때는 개발사가 마무리 작업에 몰두하며 크런치를 달리는 경우가 많아, (번역을 위한) 문의 피드백을 넣어도 제대로 답변을 받을 수가 없다. 아직 출시되지도 않은 게임을 번역가가 직접 플레이해 볼 수도 없는 노릇이니, 당연히 번역 결과 중에는 어색한 발번역이 등장할 수밖에 없는 노릇. 물론 이러한 억울함을 유저들이 모두 이해해주진 않는다.

 

2. 인공지능과 게임 채팅


인공지능이 해결하려는 게임 채팅 번역은 조금 더 어려운 주제다.

왜냐하면, 사용자의 채팅까지 실시간으로 번역하는 걸 목표로 하니까.

 

이를 위해서 두 가지 이슈를 고려하고, 또 개선해나가야 한다.

첫 번째는 연구적인 관점, 두 번째는 기술적인 관점의 이슈가 있다.

 

젊은 사람처럼 채팅하는 방법
카톡 말투처럼, 게임에서도 사용자의 말투가 있다

 

우리가 게임했었던 경험을 상기해보자. 맞춤법을 잘 지키고, 주어와 동사, 그리고 목적어도 제대로 명시해서 말하는 게임 유저를 본 적 있는지. 아마 한 두 번 정도는 그렇게 말할 수 있겠지만, 대부분의 유저 채팅은 그렇지 않다. 그러니까 크고 작은 노이즈가 가득하다는 것. 문법 오류부터 시작해서 다양한 신조어와 게임 용어 사용. 그리고 한 문장도 여러 메시지에 걸쳐 말하는 특성까지. 여기에 언어 자체가 가지는 모호성도 섞이면 정말 난장판(?)이 된다.

 

예를 들어 A, B 두 유저가 대화를 하고 있고, "형이 아이템 줘"라는 한국어 채팅을 쳤다고 가정하자. 그리고 우리의 목표는 이걸 영어로 번역하는 것이다. 문제는 저 한국어 채팅이 여러 의미로 번역될 수 있다는 것이다. (1) A(동생)가 B(형)에게 아이템을 달라는 말, (2) B(형)가 C(다른 사람)에게 아이템을 주라는 말, (3) C(형)이 우리에게 아이템을 준다는 말. 물론 저 대화 당사자인 두 유저는 저게 정확히 무슨 뜻인지 알 것이다. 왜냐하면, 상황과 대화의 맥락을 알고 있으니까. 하지만 저 채팅만 봐서는 전문 번역가도, 인공지능 모델도 100% 완벽하게 번역을 수행하기 어렵다.

 

인벤 기사에서는 게임 번역가 분들이 게임 내 스킬이나 퀘스트 설명, 그리고 NPC의 대사를 번역할 때 마주하는 어려움이 기술돼 있다. 어찌 보면 사용자 채팅보다도 표준어에 가까운 텍스트이고, 고려할 수 있는 맥락도 많을 것으로 생각한다. 그런데도 불구하고 수십 년 경력의 전문가에게도 게임 번역은 쉽지가 않다. 왜냐하면, 위에서 이야기한 것처럼 게임 채팅은 노이즈가 많고, 고려할 수 있는 맥락도 많이 부족하니까. 그러한 극한 상황에서도 조금이라도 더 정확한 번역을 위해 수많은 자연어처리 기술이 게임 채팅 번역을 위해 사용되고 있다. 많은 분들의 노력이 뒷받침되는 건 당연한 일.

 

그래서 간혹 인공지능을 잘 모르는 분들께서 이런 궁금증을 내비치시곤 한다. 이미 번역을 잘해주는 파파고나 구글 번역 같은 서비스를 이용하면 안되냐고. 충분히 이해가 되는 생각이다. 하지만, 고품질의 게임 번역을 위해 무엇이 필요했는지 다시 상기해 보자. 번역 능력뿐만 아니라 게임에 대한 지식이 필요하다. 공개된 번역기들은 범용적인 목적으로 학습되었고, 그래서 게임 지식은 충분치 않다. 실제로 한 때 파파고로 번역하면 Python3을 비단뱀3라고 번역해주기도 했었다. IT 도메인에 대한 지식이 충분하지 않았기 때문에 벌어진 일. 무엇보다 앞서 말했던 '노이즈'에 취약한 것도 문제다. 우리가 번역기를 사용할 때를 떠올려보자. 기본적으로 번역이 잘 되길 기대하기 때문에 한국어 문장을 최대한 깔끔하게 작성하려고 노력한다. 만약 번역 품질이 좋지 않다면, 문장을 다시 작성하면서 내가 원하는 번역 결과를 얻으려고 여러 번 시도한다. 하지만 게임 번역은 딱 한 번의 기회만 주어진다. 그것도 번역이 잘 되어라고 노력이 가해지지 않은 난장판(?) 그 자체인 한국어 문장으로. 이 외에도 비용이나 시간의 문제도 있다. 개인이 사용할 때나 무료이지, 회사가 사용할 때에도 번역 API가 무료일까?를 생각해 보자.

 

두 번째, 기술적인 이슈도 고민이 필요하다. 요즘 ChatGPT를 모르면 간첩이라 말할 정도로 ChatGPT는 핫한 이슈 중 하나다. 그런데 사실 인공지능을 연구하는 분들께 ChatGPT의 능력은 그렇게까지 놀라운 게 아니었다. 왜냐하면, 이미 이전에 공개되었던 수많은 모델들이 놀라운 능력을 보여줘 왔으니까. 일반인들에게는 ChatGPT가 하늘에서 뚝 떨어진 것처럼 보이겠지만, 연구 분야에서는 서사가 있는 결과물이었다.

 

오늘날에는 마이크로소프트 애저(Microsoft Azure) 클라우드 서비스에서 수만 대의 최신 엔비디아 A100 및 H100 텐서 코어(Tensor Core) GPU가 챗GPT(ChatGPT)와 같은 모델에 대한 학습 및 추론을 처리한다.

출처 : 엔비디아 젠슨 황, 오픈AI 공동 창립자 수츠케버와 대담 (https://www.tnews.kr/news/articleView.html?idxno=108176)

 

나 역시도 ChatGPT가 처음 등장했을 때, 그 응답 생성 능력에는 놀라지 않았었다. 당연한 거라 생각했으니까. 오히려 이 거대한 모델이 굉장히 빠른 속도로 응답을 생성한다는 점이 신기하다 못해 경악스러울 정도였다. 이를 위해 ChatGPT는 마이크로소프트의 클라우드 서비스 애저(Azure)의 최신 GPU 수만 대를 동원하고 있다.

 

그러면 다시 게임 채팅으로 돌아와 보자. 인공지능 모델이 크기 경쟁을 하고 있는 건, 단적으로 크기가 커질수록 인공지능의 성능도 높아지기 때문이다. 그러면 게임 채팅 번역 역시도 거대한 모델을 쓴다면 번역을 잘해줄 수 있지 않을까? 맞는 말이다. 그런데 게임 채팅은 실시간(Real time)이라는 강력한 조건이 부여된다. 그러면 여기서 딜레마가 발생되는 것. 더 좋은 성능을 위해서는 더 거대한 모델이 필요한데, 그러면 실시간으로 번역하는 게 어려워진다. 게임 번역을 위해 ChatGPT처럼 수많은 GPU를 동원할 수 있을까? 그럴 수 있다면 좋겠지만, 현실은 그리 낭만적이지 않다. 왜냐하면, 게임회사의 메인은 게임이지 인공지능이 아니니까. 사실 게임뿐만 아니라 어떤 상용 서비스를 하든 인공지능 개발은 어느 정도 타협해야 하는 부분이 생길 수밖에 없다. 쇼케이스로 잠깐 동안 서비스하는 게 아니라면. 따라서 제한된 리소스에서 최대한의 효율을 뽑아내는 것, 그것이 더 좋은 모델을 사용하면서도 사용자에게 쾌적한 서비스를 제공하기 위해 고민해야 하는 기술적인 이슈일 것이다.

320x100
  • 네이버 블로그 공유
  • 네이버 밴드 공유
  • 페이스북 공유
  • 카카오스토리 공유