[코멘트] 바이두, 딥러닝 기반 음성합성 'DeepVoice 3' 발표...목소리 자체의 콘텐츠化도 가능
[코멘트] 바이두, 딥러닝 기반 음성합성 'DeepVoice 3' 발표...목소리 자체의 콘텐츠化도 가능
이 기사를 공유합니다

바이두가 텍스트를 음성으로 전환하는 음성합성 기술 ‘딥보이스(DeepVoice)’의 세 번째 버전을 발표함. 바이두는 올해 초 수 시간 분량의 음성 데이터를 학습해 텍스트를 해당 목소리로 전환하는 딥보이스 기술을 최초로 발표한 이후, 5월에 30분 분량의 음성 데이터를 학습해 해당 목소리를 모방할 수 있는 딥보이스2 기술을 발표한 바 있음. 그리고 새롭게 발표된 딥보이스3의 경우 30분 분량의 음성 데이터 학습만으로 가능하며, 2,500여개의 서로 다른 목소리를 낼 수 있음. 이 같은 음성합성 기술은 다양한 부문에 적용될 수 있는데, 오디오북이나 비디오 게임의 경우 서로 다른 등장인물에 적용될 수 있음.
아티클 전문보기

관련 아티클