NO.1: 로또 발급시간
일본 NTT 음성변환 기술 개발
음성과 말하는 방법,로또 발급시간맘에 드는 스타일로
언론들 "고성·폭언 많은 콜센터서 필요"
어눌한 영어도 유창하게 바꿔줘
고함으로 가득찬 악성민원인의 목소리를 듣기 편하게 바꿔주거나 어눌한 영어발음을 유창하게 바꿔주는 기술이 일본에서 개발됐다.
일본 NTT는 17일 "목소리와 말하는 방법을 마음에 드는 스타일로 순식간에 바꾸는 음성변환 기술을 개발했다"고 발표했다.이 기술은 대면이나 원격을 불문하고,로또 발급시간다양한 음성 커뮤니케이션에서의 음성 변환을 가능하게 해준다.NTT는 "이 기술은 웹 회의 및 실시간 전송 등에서 실시간 음성 변환이 가능하다"면서 "앞으로는 스마트폰이나 VR 디바이스 상에서의 이용 등 다양한 장면에서의 응용이 기대된다"고 했다.NTT는 오는 24일부터 개최되는 커뮤니케이션 과학 기초 연구소 오픈 하우스 2024에서 선보일 예정이다.
일본 언론들은 '카스하라'(고객괴롭힘)가 만연한 일본에서 콜센터에서 악성민원인의 목소리를 실시간으로 음성전환해 콜센터 직원이 편한하게 응대할 수 있고 말이 서툰 장애인과의 대화도 쉬워질 것으로 기대했다.또한 영어로 회의나 대화를 할 경우에도 서툰 발음을 원어민에 가깝게 해주거나 긴장해 떨리는 음성도 고쳐줄 수 있다는 것이다.
NTT는 두 가지의 기술적 특징이 있는데 하나는 화자의 음성 특징을 다른 화자의 음성 특징으로 변환해주는 것이고 다른 하나는 저지연 변환 처리라고 말했다.이는 회의나 대화가 실시간으로 진행되고 있어서 음성변환 시스템을 통해 변환된 음성이 시간이 지연되거나 중간에 끊기지 않고 실시간으로 상대방에게 전달되는 것이다.
일본 소프트뱅크도 최근 인공지능(AI) 기술을 사용해 음성변조전화 기술인‘감정 취소’를 개발한 것으로 알려졌다.홍콩 사우스차이나모닝포스트(SCMP)의 보도를 보면 소프트뱅크 엔지니어인 나카타니 토시유키는 카스하라를 겪는 콜센터 직원을 보호하기 위해 기술을 개발했다.이 기술은 고함을 지르거나 톤을 높인 발신자의 목소리를 식별해 자연스럽고 차분하게 만든다.고음의 여성목소리는 톤을 낮추고 위협적으로 들릴 수 있는 남성의 목소리는 부드럽게 바꾸는 것이다.