구글, End-to-End 뉴럴 오디오 코덱 SoundStream 공개


제목	구글, End-to-End 뉴럴 오디오 코덱 SoundStream 공개2021-08-17 22:38
작성자	happydaddy
https://ai.googleblog.com/2021/08/soundstream-end-to-end-neural-audio.html - 음성과 음악 양쪽에 적용 가능한 최초의 뉴럴 네트워크 코덱 ㅤ→ 실시간으로 스마트폰 CPU에서 실행 가능 ㅤ→ 고품질 오디오 및 깨끗한 음성, 잡음과 잔향이 많은 음성, 음악 및 환경소리를 포함한 다양한 사운드 유형을 인코딩 - 양쪽 종단에서 신경망을 이용하여 훈련되어, 압축과 음질향상을 동시에 수행하여 높은 품질의 오디오 제공 ㅤ→ SoundStream은 3kbps 에서 Opus 12 kpbs 를 능가하고, EVS 9.6bps 정도의 퀄리티를 제공 ㅤ→ 3.2x-4x 적은 비트만 이용하므로 전송량을 대폭 줄일 수 있음 ㅤ→ 훌륭한 수준의 잡음 제거 가능 - 올해 초에 공개했던 Low-Bitrate 음성용 코덱 Lyra에 통합 예정 G M T Y Text-to-speech function is limited to 200 characters Options : History : Feedback : DonateClose

이전	Google 접속자로 집계한 IPv6 국가별 순위	happydaddy	2021-08-17
다음	WorkAdventure - 오픈소스 메타버스 플랫폼 소프트웨어	happydaddy	2021-08-17

Tech News