한윤창 코클리어닷에이아이 대표

사용자의 음성 명령도 화났는지 졸린지 구분
비언어적 소리 분석…AI스피커 한계 보완

코클리어닷에이아이의 공동 창업자들. 왼쪽부터 임현기, 한윤창(CEO), 박정수, 이수빈(COO), 이돈문, 정일영 씨. /코클리어닷에이아이 제공

올 한 해 정보기술(IT)업계에서 가장 주목받은 상품은 단연 인공지능(AI) 스피커다. 아마존, 구글은 물론 SK텔레콤, KT 등 통신사와 네이버, 카카오 같은 인터넷 기업들까지 잇따라 제품을 선보이면서 보급률도 빠르게 높아지고 있다.

현재 AI 스피커의 한계는 말로만 대화할 수 있다는 점이다. 알렉사(아마존)든 클로바(네이버)든 기계에 ‘내가 지금부터 명령한다’는 사실을 알려줘야 한다.

올 7월 창업한 코클리어닷에이아이는 이 같은 AI 스피커의 한계를 보완할 수 있는 기술을 연구하는 회사다. 바로 머신러닝 알고리즘을 이용해 비언어적 소리를 분석하는 기술이다. 발걸음 소리, 기침 소리 등을 인식해 사물인터넷(IoT) 기반 서비스와 기술에 적용할 계획이다.

창업자인 한윤창 대표는 “언어나 숫자를 인식하는 음성인식은 많은 회사들이 집중적으로 연구하고 있지만 그 밖의 비언어적 소리를 인식하는 기술은 아직까지 연구가 많이 진행되지 않았다”고 창업 이유를 밝혔다.
한 대표를 비롯한 6명의 공동창업자들은 모두 서울대 음악오디오연구실 석박사생들이다. 이 회사는 지난 10월 미국전기전자공학회(IEEE) 주최로 열린 오디오 환경음 분석대회(DCASE 2017)에서 경고음 검출과 무인자동차 환경소리분류 분야에서 1위, 환경음분류와 소리이벤트 검출 분야에서 2위를 차지하는 등 기술력을 인정받았다.

한 대표는 “비언어적 소리를 인식하면 상황 파악을 할 수 있다”며 “굳이 명령하지 않아도 AI가 사용자에게 필요한 것을 먼저 제안해줄 수 있다”고 설명했다. 기침 소리와 가스레인지에 물 올리는 소리, 컵을 식탁 위에 내려놓는 소리를 들었다면 사용자가 감기에 걸려 따뜻한 차를 끓여 마시는 상황이라고 인식해 보일러와 가습기를 작동하는 동시에 잔잔한 음악을 틀어줄 수 있다. 음성 명령을 할 때도 단순히 텍스트만 인식하는 데 그치지 않고 화가 났는지, 졸린지, 숨이 차서 말하는지 구분할 수 있다.

현재는 다양한 종류의 소리 데이터를 수집하는 데 주력하고 있다. 이를 위해 지난달 케이큐브벤처스로부터 3억원의 투자도 받았다. 한 대표는 “오디오 기반 머신러닝 알고리즘 개발의 핵심은 양질의 데이터 확보”라며 “다양한 소리에 담긴 정보를 사람처럼 인지할 수 있는 플랫폼을 만들기 위해 기술 연구와 오디오 데이터 확충에 주력할 것”이라고 말했다.

내년부터는 외부 개발자들도 이용할 수 있는 앱 프로그래밍 인터페이스(API)를 만들어 사용 범위를 늘리는 동시에 데이터를 수집할 계획이다. 네이버, 카카오 등 AI 스피커를 만드는 회사와도 협력 논의를 진행 중이다. 한 대표는 “우리 기술이 AI 스피커를 차별화하는 데 기여할 수 있을 것”이라고 기대했다.

이승우 기자 leeswoo@hankyung.com

ⓒ 한경닷컴, 무단전재 및 재배포 금지