딥러닝 방식 통해 얼굴·목소리 합성
"딥페이크가 큰 문제 초래할 것" 경고

유명인 음성으로 바꿔주는 기술 개발
구글 AI는 인간 목소리로 전화 걸어

미국 버즈피드가 인공지능(AI) 기술로 제작한 버락 오바마 전 미국 대통령의 가짜 동영상. /버즈피드 캡처

“트럼프는 완전히 쓸모없는 인간(complete dipshit)이야.”

버락 오바마 전 미국 대통령이 도널드 트럼프 대통령을 향해 진지한 표정으로 ‘독설’을 내뱉는다. 성조기가 걸린 집무실에 앉은 그가 단호한 손동작까지 섞어가며 조곤조곤 말하는 모습이 보는 이들을 어리둥절하게 한다.

최근 인터넷에 올라온 동영상 속 오바마는 진짜 오바마가 아니다. 미국 온라인매체 버즈피드가 인공지능(AI) 기술로 얼굴과 목소리를 합성해 만들어낸 가짜 오바마다. 컴퓨터가 데이터를 축적해 학습하는 딥러닝 방식을 활용, 거짓으로 만들어낸 ‘딥페이크(deepfake)’의 위험성을 경고하는 취지에서 제작한 것이다.

인공지능(AI) 기술로 버락 오바마 전 미국 대통령의 합성 동영상을 제작하는 모습. /AP연합뉴스

AP통신 등 외신들은 가짜뉴스의 위력을 훨씬 능가하는 딥페이크가 1~2년 내에 정치권과 국제사회에 큰 문제를 초래할 수 있다고 경고했다. 특정인의 표정이나 버릇, 목소리, 억양 등을 그대로 흉내내면서 하지도 않은 말을 한 것처럼 만들 수 있어서다. 현 단계의 딥페이크 영상은 사람이 눈을 깜박이는 모습 등 일부가 다소 부자연스럽게 표현되는 한계가 있지만 이마저도 개선돼 가고 있다.

이런 기술은 지금까진 유명인 풍자나 개그맨의 웃음거리 소재 정도로 활용됐지만 사회 안정을 위협하는 악의적인 활동에 쓰일 수 있다는 우려가 나온다.
미 공화당 소속 마코 루비오 상원의원은 “외국 정보기관이 가짜 동영상을 만들어 미국 정치인이나 미군의 평판을 크게 훼손할 수 있다”고 경고했다. 예를 들어 뇌물을 받거나 인종차별적 욕설을 내뱉는 정치인, 민간인을 학살하는 미군에 관한 가짜 동영상을 유포할 수 있다는 것이다. 해외에는 이미 할리우드 유명 연예인의 얼굴을 합성한 음란물이 퍼진 전례가 있다.

AI 산업 한쪽에서는 더 감쪽같은 합성 기술을 개발하려는 연구가, 다른 한쪽에선 이를 잡아내는 판별 기술을 개발하려는 연구가 활발히 이뤄지고 있다. 캐나다 스타트업(신생 벤처기업) 라이어버드는 사용자 목소리를 유명인사 목소리로 감쪽같이 바꿔주는 AI 기술로 벤처캐피털에서 거액의 투자를 유치했다. 구글은 AI가 인간의 목소리로 식당에 전화를 걸어 예약하는 ‘듀플렉스’ 기술을 지난달 말부터 시범 가동하기 시작했다. 네이버도 4시간 분량의 녹음파일만 있으면 음성 합성이 가능한 단계의 기술력을 확보하고 있다.

미국 국방부 산하 방위고등연구계획국은 2016년 가짜 사진이나 동영상을 가려내는 기술을 개발하기 위한 4년간의 연구사업에 착수했다. 딥페이크 기술의 발전 속도가 이를 방지하는 기술 개발 속도보다 빠르다는 게 문제라고 AP통신은 전했다.

김대식 KAIST 교수는 “딥러닝으로 만든 가짜 비디오를 완벽하게 자동으로 구별하는 기술은 존재하지 않는다”며 “정치, 경제, 기업 등 여러 영역에서 민주주의의 핵심 가치인 ‘신뢰’가 존재하기 어려운 세상으로 갈 가능성이 있다”고 지적했다.

가짜 오바마 영상을 만든 버즈피드가 딥페이크에 대한 해결책으로 제시한 것도 ‘개인의 판단력’이었다. 스스로 정보 출처를 잘 확인하고, 영상에 어색하거나 논리적으로 안 맞는 대목이 없는지 확인하라는 조언이다.

임현우 기자 tardis@hankyung.com
스타트업·인터넷·게임업계를 취재하고 있습니다 :)

ⓒ 한경닷컴, 무단전재 및 재배포 금지