디지털 휴먼, 인간의 친구가 될 수 있을까?

1. 사실성(寫實性)으로 주목받는 디지털 휴먼

로지, 수아, 한유아, 김래아, 루시, 여름, 수진, 혜진, 서아, 민지, 함초롱, 제나, 리나, 시우라, 루이, 루다, 정세진, 테오…

한국어인 듯, 영어인 듯한 이름을 짓는 것이 유행이라고 한다. 그래서인지 요즘 태어난 아기의 이름처럼 보이는 이러한 이름은 모두 디지털 K-셀럽이다. 디지털 휴먼(Digital Human), 메타 휴먼(Meta Human), 사이버 휴먼(Cyber Human), 버추얼 휴먼(Virtual Human), 가상 인간 등 이름은 제각각이지만 결국 사람의 모습을 한 컴퓨터 그래픽 인간이다(정동훈, 2021).

컴퓨터 소프트웨어로 만든 인간이 우후죽순처럼 등장하고 있다. 이제까지 소프트웨어로 만든 가상의 인간은 많이 있었다. 만화 캐릭터도 가상의 인간이다. 누구도 진짜 사람이라고 생각하지는 않지만, 만화 캐릭터에 감정을 이입하면 인간보다 더 큰 관계를 형성할 수 있다. 이럴 경우, 덕후네 오타쿠네 하며 놀림을 받을 수는 있겠지만…

최근 디지털 휴먼이 관심을 받는 이유는 사실성에 있다. 즉 실제 인간과 구분하기 어려울 정도로 똑같아 보이기 때문이다. 이 모든 것은 결국 기술 발전에 기반한다. 밑에 있는 QR 코드(QR code 1)는 언리얼 엔진이라는 게임엔진을 만드는 에픽게임즈에서 2018년에 소개한 디지털 휴먼 ‘사이렌’ 영상이다.

QR code 1

여러분의 이해를 돕기 위해서 ‘사이렌’이 어떻게 만들어졌는지 비하인드 영상을 함께 준비했다(QR code 2). <아바타>나 <혹성탈출>과 같은 영화와 게임의 캐릭터는 모션 캡처를 통해 표정과 움직이는 모습 등을 촬영한다. 모션 캡처는 자연스러운 몸짓을 만드는 데 필요하다. 자연스러운 얼굴 모습과 몸짓을 촬영해서 이를 실시간으로 구현 가능하므로 가상 인간 제작에서 대부분 사용된다(정동훈, 2022).

QR code 2

이번에는 같은 회사에서 2021년 2월에 소개한 새로운 소프트웨어 프로그램인 메타 휴먼 크리에이터(MetaHuman Creator)를 통해 최근 디지털 휴먼의 제작 기술이 어느 정도까지 이르렀는지 확인해보자(QR code 3). 메타 휴먼 크리에이터로 만든 사이버 휴먼은 사실성이 매우 뛰어나다. 입 모양, 입이 움직일 때 얼굴 근육의 움직임, 말을 할 때 머리 부분이 미세하게 움직이는 것조차 구현할 수 있다. 클릭 하나로 머리 모양과 수염, 주름, 나이대와 눈, 얼굴, 몸 등 모든 것을 마음대로 바꿀 수 있으니 똑같이 생긴 디지털 휴먼은 존재하지 않는다. 단지 3년 만에 이루어진 디지털 휴먼 제작 도구의 혁신이다.

QR code 3

2. 인공지능으로 의인화되는 디지털 휴먼

최근 챗봇(Chatbot)을 활용하는 기업이 많아졌다. 챗봇은 채터봇(Chatterbot)이라고도 하는데, 말 그대로 채팅하는 로봇을 말한다. 대화하는 인공지능 기계라고 생각하면 된다. 네이버, 카카오톡, 페이스북 등 대부분의 커뮤니케이션 사업을 하는 기업은 챗봇을 구동할 수 있는 서비스를 제공하고, 은행이나 카드회사, 보험회사, 통신사 등의 1:1 대화는 대부분 챗봇이 응대한다. 간단한 문의 사항 등은 텍스트, 이미지, 인터넷 사이트 등을 제공하며 빠른 속도로 응답함으로써 고객 만족도를 높이려고 한다.

챗봇은 딥 러닝을 활용해서 커뮤니케이션하는데, 1년 365일, 24시간 쉬지 않고 고객의 물음에 일일이 답할 수 있어서 기업으로서는 매우 효율적이다. 그러나 챗봇이 불편한 사용자도 있다. 이런 경우를 대비해서 직원과 채팅할 수 있는 기능도 만들어놓았지만, 직원을 고용하는 것은 기업으로서는 비용이 들기 때문에 가능한 한 챗봇을 활용하려고 한다. 그래서 등장한 서비스가 바로 디지털 휴먼 챗봇이다.

챗봇이 텍스트 기반으로 대화한다면, 디지털 휴먼 챗봇은 인간의 모습을 한 에이전트가 대화한다. 물론 인공지능이 탑재돼있기 때문에 사전에 시뮬레이션이 된 대로 대화가 가능하다. 고객이 자주 하는 질문을 데이터베이스화한 후에, 이 질문에 적합한 답변을 사전에 준비해서 시뮬레이션하는 식이다. 아직 우리나라에서는 찾아보기 힘들지만, 유니큐(UneeQ)는 이와 관련해서 가장 앞선 기술을 가진 기업이다. 이 기업에서는 금융업, 통신사, 헬스케어, 소매업, 고객 관리 등의 분야에서 디지털 휴먼을 활용할 수 있는 솔루션을 개발 중이다. 이미 현장에서 사용 중인 솔루션의 성과는 고객 만족도가 95%에 이를 정도로 큰 성공을 거두었다(Spark 64, 2021).

디지털 휴먼의 미래는 단지 사람과 똑같이 만드는 모습에 그치지 않을 것이라는 점에서 큰 기대를 할 수 있다. 사람이 사람을 만나 나누는 커뮤니케이션을 일컫는 대인 커뮤니케이션(interpersonal communication)은 테크놀로지가 지향하는 가장 이상적인 커뮤니케이션 양태이다. 대인 커뮤니케이션을 통해 우리는 말하고 듣는 것에 더해, 얼굴과 몸짓으로 단어가 전하지 못하는 함의를 파악하고, 향수와 같이 후각으로 파악할 수 있는 정보를 통해서 상대방을 정의할 수도 있으며, 손과 몸이 닿으며 전하는 의미를 파악하게 된다. 이러한 과정은 커뮤니케이션을 위한 지식, 지식을 전달하는 능력, 그리고 정보 이해 능력이 필요한데, 이 모든 것을 종합적으로 수행해야 하므로 뛰어난 정보 처리 능력을 요구한다. 디지털 휴먼의 미래는 바로 이러한 대인 커뮤니케이션 능력을 포함함으로써, 인간보다 더 인간 같은, 그리고 더 뛰어난 정보 전달 능력과 설득 능력을 갖출 수 있다는 점에서 사회 각 영역에서 활용 가치가 뛰어나다. 결국, 디지털 휴먼의 핵심은 커뮤니케이션이다. 그런 점에서 디지털 휴먼은 챗봇 캐릭터고, 지능형 로봇이다.

3. 지능형 디지털 휴먼으로 진화하다

디지털 휴먼의 미래를 예측하는 것은 그리 어려울 것 같지 않다. 미디어 테크놀로지와 관련된 아주 유명한 책 중 하나인 ‘미디어 방정식’에서 저자는 미디어와의 상호작용은 인간의 그것과 똑같다는 결론을 내린다(Reeves, & Nass, 1996). 수많은 연구 결과를 통해 이끈 결론은 우리가 사람을 만나면서 겪게 되는 태도와 성격, 감정 등을 미디어를 사용하면서도 동일하게 경험한다고 말한다. 우리는 실제로 표현할 수 없는 것을 재현할 수 있는 것에 놀라고, 눈앞에 보이는 것에 반응하며, 금세 익숙해지고, 사회적 관계를 맺게 된다는 것이다.

롬바르드와 디튼(Lombard & Ditton, 1997) 역시 일찍이 프레즌스(presence)를 이야기하며 이와 같은 논의를 진행했다. 집에서 키우는 반려동물은 더 이상 동물이 아닌 가족이다. 함께 TV를 보고, 침대에서 자며, 식사 시간을 공유하는 반려동물은 사람으로 인식되는 것이다. 같은 논리로 로봇의 미래를 예측할 수 있다. 소셜(social) 로봇 혹은 반려(companion) 로봇이라고 일컫는 로봇은 인간과 사회적 관계를 형성한다. 그래서 롬바르드와 디튼은 사람과 사회적 관계를 형성하는 것에 대해 사회적 행위자로서 미디어(medium as social actor)라고 이름 지으며, 미디어와 상호작용하는 것이 사람의 그것과 다르지 않다고 보았다.

결국, 디지털 휴먼의 핵심은 로봇 연구에서 보인 것처럼 불쾌한 골짜기(uncanny valley)를 얼마나 빨리 벗어날 수 있을까 여부에 있다(Mori, 1970). 불쾌한 골짜기는 인간의 외양과 유사성이 닮아갈수록 호감도가 증가하지만, 그 유사성이 약 70% 정도에 이르면 호감도가 뚝 떨어지는 것을 의미한다. 유사성이 약 90% 정도에 이르러서야 비로소 호감도는 다시 증가하기 시작해서 100% 똑같아질 때야 호감도가 이전의 최고 호감도 이상으로 증가하게 되는 것이다. 디지털 휴먼 역시 지금이야 호기심으로 긍정적 평가를 할 수 있지만, 시간이 흐를수록 인간에 버금가는 정교함이 요구된다.

메타버스가 현실과 공존하는 새로운 세계로 등장하고, 이 공간을 채우는 다양한 콘텐츠가 소개되고 있다. 엔비디아, 어도비, 오토데스크, 유니티, 언리얼 엔진 등이 사실감을 극대화하며 현실과 같은 물리법칙이 적용된 가상의 공간을 만들고, 이러한 공간에 메타휴먼 크리에이터로 만든 에이전트인 디지털 휴먼이 돌아다니면서, 인간과 상호작용하며 무언가를 하는 시대가 온다는 것은 자연스러운 미래 예측이 아닐까? 이러한 세상이 되면 진짜 사람과 가짜 사람(에이전트)의 구분이 무슨 의미가 있을까?

인공지능 기술을 이용해서 서로 다른 영상들을 합성하는 딥페이크(Deep Fake) 기술을 기반으로 하면, 초상권을 지불하지 않거나, 최소화할 수 있다. 수백, 수천 명의 얼굴을 합성해서 세상에 존재하지 않는 얼굴을 만들기 때문에 내 얼굴이 들어있는지 알 수가 없고, 설령 초상권을 지불한다고 하더라도 일반인들의 얼굴을 기반으로 해서 큰 문제가 되지 않는다. 여기에 인공지능으로 가상의 목소리를 만들고, 진짜 같은 몸짓을 하게 만든다면, 게다가 내가 좋아하는 이상형으로 만들어진다면, 가상 세계에서의 인간관계는 현실보다 더 좋아지지 않을까?

아직 디지털 휴먼은 인스타그램에서 보이는 이미지나, 가끔 수천만 원을 투자해서 만든 짧은 동영상을 통해서만 만날 수 있지만, 인공지능 기술의 발달은 사실성과 비용을 모두 해결할 것이다. 상황판단과 상호작용이 가능한 지능형 디지털 휴먼이 소개되면, 학교 폭력을 걱정해야 하는 아이돌도, 음주 운전을 우려하는 스타도, 24시간 365일 어떠한 사고도 없이 일할 수 있는 디지털 휴먼의 효율성을 이기기는 힘들 것이다.

인스타그램, 틱톡, 유튜브 등의 소셜미디어를 통해 경험하는 대중문화나, 온라인 강의, 고객 응대, 제페토나 이프랜드에서 만나는 친구 등 테크놀로지를 통해 접하는 관계 형성은 디지털 휴먼의 존재 가치를 더욱 빛나게 할 것이다. 중요한 것은 디지털 휴먼의 미래가 단지 엔터테인먼트 분야뿐만 아니라, 정보 전달, 설득 등 커뮤니케이션의 전 영역에서 벌어질 것이라는 점이다. 디지털 휴먼 기술이 안정화되면, 다음은 로봇과 결합하여 하드웨어와 소프트웨어가 모두 인간과 유사해지는 상황이 될 것이다. 이 모든 것이 앞으로 10년 이내에 벌어질 일들이다. 디지털 휴먼이 인간과 사회적 관계를 맺을 날이 머지않았다.

[참고문헌]

정동훈(2021). 가상 인간, 경계를 지우다. Available : https://www.kocca.kr/n_content/vol21/sub/trend2.html

정동훈(2022). 「메타버스, 너 때는 말이야」. 서울: 넥서스

Lombard, M., & Ditton, T. (1997). At the heart of it all: The concept of presence. Journal of computer-mediated communication, 3(2), JCMC321, https://doi.org/10.1111/j.1083-6101.1997.tb00072.x

Mori, M. (1970). The uncanny valley: the original essay by Masahiro Mori. IEEE Spectrum.

Reeves, B., & Nass, C. (1996). The media equation: How people treat computers, television, and new media like real people and places. Cambridge, UK: Cambridge Univ. Press

Social Media(2022). India Social Media Statistics 2022: Most Used Top Platforms. Available : https://www.theglobalstatistics.com/india-social-media-statistics

Spark 64(2021). Insurance Digital Human Assistant. Available : https://www.spark64.com/project/insurance-digital-human-assistant

저자 : 정동훈

광운대학교 미디어커뮤니케이션학부 교수