뉴톤 톡은 입력된 문장을 음성으로 변환해주는 음성 합성 엔진으로 지난 6월 다음카카오가 선보인 바 있다. 자체 개발한 한국어 운율 모델을 이용해 사람의 발성을 재현하고, 대용량·자동화 처리 기술로 다양한 한국어 문장을 빠르게 학습하고 운율을 예측할 수 있다.
뉴톤 톡의 새로운 낭독체는 사람이 읽어주듯 자연스러운 음색이 특징. 밝고 부드러운 음색의 성우가 기존 낭독체보다 2배 이상 많은 문장을 녹음한 데이터를 이용했기 때문에 어떤 문장 조합에도 유연하게 대응할 수 있다고 다음카카오 측은 설명했다.
또 일상적인 대화체 음성의 표현도 가능해졌다. 예를 들어 ‘안녕’이라는 단어가 문장 앞부분에 있으면 끝 음을 올리고, 문장 중간에 포함되면 앞뒤 단어와의 연결에 따라 끝 음을 내리거나 동일 음조로 처리하는 방식이다.
구동욱 다음카카오 음성처리파트장은 “뉴스나 책 구절 등의 장문 낭독을 대신하거나 모바일 메시지를 대화체 음성으로 변환하고 시각 장애인을 위한 생활형 서비스를 개발하는 등 다양한 영역에서 뉴톤 톡의 기능을 활용할 수 있다”고 말했다.









