[코멘트] 바이두, 딥러닝 기반 음성합성 'DeepVoice 3' 발표...목소리 자체의 콘텐츠化도 가능

- 가나다라마바사
- 가나다라마바사
- 가나다라마바사
- 가나다라마바사
- 가나다라마바사
- 가나다라마바사

승인 2017.10.25 11:31
아티클 전문보기

- 가나다라마바사
- 가나다라마바사
- 가나다라마바사
- 가나다라마바사
- 가나다라마바사
- 가나다라마바사

이 기사를 공유합니다

바이두가 텍스트를 음성으로 전환하는 음성합성 기술 ‘딥보이스(DeepVoice)’의 세 번째 버전을 발표함. 바이두는 올해 초 수 시간 분량의 음성 데이터를 학습해 텍스트를 해당 목소리로 전환하는 딥보이스 기술을 최초로 발표한 이후, 5월에 30분 분량의 음성 데이터를 학습해 해당 목소리를 모방할 수 있는 딥보이스2 기술을 발표한 바 있음. 그리고 새롭게 발표된 딥보이스3의 경우 30분 분량의 음성 데이터 학습만으로 가능하며, 2,500여개의 서로 다른 목소리를 낼 수 있음. 이 같은 음성합성 기술은 다양한 부문에 적용될 수 있는데, 오디오북이나 비디오 게임의 경우 서로 다른 등장인물에 적용될 수 있음.

아티클 전문보기

[브리핑] 美 시냅틱스, 음성-오디오 인식 전문업체 인수

[브리핑] 中 Ximalaya, 오디오 콘텐츠 서비스로 인기몰이

[코멘트] 국내 언론사들, 음성 뉴스서비스 출시 러시...기사 작성-편집-전달 전분야로 AI 도입 확대

[브리핑] 구글홈, 음성인식률 향상 위한 오디오 볼륨 자동조절 기능 추가

[코멘트] AI 스피커 시대, 음성 콘텐츠에 대한 관심 증가...양방향성 고려 제공 방식도 최적화되어야

[코멘트] 英 BBC, AI 스피커 전용 인터렉티브 라디오 드라마 제작...새로운 형태의 오디오 콘텐츠로 주목

[코멘트] 아마존, 알렉사에 화자인식 기능 도입...가정 내 복수 단말 시대 맞아 이용편의성 더욱 증대