
음성 합성 엔진
최근 수정 시각:
음성 합성 엔진
|
'음성 합성 엔진'의 사전적 의미에 따르면 모든 종류의 Text to Speech가 이 분류에 속하지만, '음성 합성 엔진 팬덤'(구 보컬로이드 팬덤)에서는 일반적으로는 샘플링 방식의 가창 음성 합성(Singing Voice Synthesis) 중에서도 대체로 이미지 캐릭터가 붙은 것[2]만을 가리킨다. 다만 상표의 보통명사화로 간주해서 계속 보컬로이드라는 명칭을 고수하는 사람도 적지 않은 편이다.
이렇게 된 것은 당초에 VOCALOID와 가장 인기 있던 라이브러리인 하츠네 미쿠 중심으로 팬덤이 형성되었기 때문이다. 이 당시에는 야마하의 등록 상표였던 VOCALOID가 SVS 전체를 대표하는 대명사로 불렸으나, 하츠네 미쿠의 개발사 크립톤 퓨처 미디어가 VOCALOID로부터 독립하여 자주 제작 엔진 하츠네 미쿠 NT를 발매하였고[3], 동시기에 Synthesizer V나 CeVIO 등의 경쟁 상품들이 등장하여 더 이상 VOCALOID가 SVS를 대표하기 어려워졌다. 이로 인해 주간 VOCALOID 랭킹이 주간 VOCAL Character 랭킹으로 이름이 바뀌는 등 VOCALOID에 한정되지 않은 SVS 제품군의 명칭에 대한 논의가 있었고, 한국에서는 '음성 합성 엔진'이라는 다소 포괄적인 명칭으로 정착하였다. 실제로 CeVIO 등 일부 제품군의 경우 SVS이면서 TTS를 겸하고 있는 경우가 있다.
일본에서는 가성 합성 소프트(歌声合成ソフト) 또는 보카로 소프트(ボカロソフト) 라고 주로 불리며, 음성 합성 소프트(音声合成ソフト)는 마찬가지로 SVS와 TTS를 포괄하는 명칭이다. 영어권에서는 Singing Voice Synthesizer 또는 Vocal Synthesizer[4]라고 하는데, 이쪽은 '보카로 팬덤'과 관계없이 (물론 특성상 보카로 팬덤의 파이가 크긴 하지만) 모든 SVS를 통칭한다.
이렇게 된 것은 당초에 VOCALOID와 가장 인기 있던 라이브러리인 하츠네 미쿠 중심으로 팬덤이 형성되었기 때문이다. 이 당시에는 야마하의 등록 상표였던 VOCALOID가 SVS 전체를 대표하는 대명사로 불렸으나, 하츠네 미쿠의 개발사 크립톤 퓨처 미디어가 VOCALOID로부터 독립하여 자주 제작 엔진 하츠네 미쿠 NT를 발매하였고[3], 동시기에 Synthesizer V나 CeVIO 등의 경쟁 상품들이 등장하여 더 이상 VOCALOID가 SVS를 대표하기 어려워졌다. 이로 인해 주간 VOCALOID 랭킹이 주간 VOCAL Character 랭킹으로 이름이 바뀌는 등 VOCALOID에 한정되지 않은 SVS 제품군의 명칭에 대한 논의가 있었고, 한국에서는 '음성 합성 엔진'이라는 다소 포괄적인 명칭으로 정착하였다. 실제로 CeVIO 등 일부 제품군의 경우 SVS이면서 TTS를 겸하고 있는 경우가 있다.
일본에서는 가성 합성 소프트(歌声合成ソフト) 또는 보카로 소프트(ボカロソフト) 라고 주로 불리며, 음성 합성 소프트(音声合成ソフト)는 마찬가지로 SVS와 TTS를 포괄하는 명칭이다. 영어권에서는 Singing Voice Synthesizer 또는 Vocal Synthesizer[4]라고 하는데, 이쪽은 '보카로 팬덤'과 관계없이 (물론 특성상 보카로 팬덤의 파이가 크긴 하지만) 모든 SVS를 통칭한다.
[1] 캐릭터가 없는 라이브러리도 있다. 주로 상업이용이 가능하며 캐릭터가 있는 것보다 저렴하여 TTS의 경우 세트로 판매된다[2] 이미지 캐릭터가 붙지 않은 가창 음성 합성의 역사는 VOCALOID보다도 더 오래되었으며, 현재에도 합성 성악은 꾸준히 연구 및 활용되고 있다. 솔로가 아닌 코러스에 한한다면 재현시 요구하는 정밀도가 낮기 때문에 수요도 어느 정도 존재한다. 다만 방송물의 배경음악, 게임 배경음악 등 산업디자인의 요소로서만 주로 활용되며 SVS 그 자체를 가수로서 내세워 상업적 성공을 거둔 예는 하츠네 미쿠 이외에는 극히 적다. 음성 합성 엔진 팬덤에서 취급하는 SVS 음원 중에서 이미지 캐릭터가 붙지 않은 것도 있으며(VY 시리즈) 반대로 TTS에 이미지 캐릭터가 붙어도 취급하지 않는 경우가 있으므로(타입캐스트) 절대적인 요건은 아니다.[3] 당시에는 하츠네 미쿠 NT의 발매로 인해 하츠네 미쿠가 VOCALOID로부터 독립하는 것이라고 여겨졌다. 프로젝트 세카이 컬러풀 스테이지! feat.하츠네 미쿠에서 크립톤 음원 6인방이 '보컬로이드'가 아니라 '버추얼 싱어'라는 이름으로 나온 것도 VOCALOID에 종속되지 않으려는 의도인 것으로 간주되었다. 그러나 크립톤 퓨처 미디어가 야마하와 완전히 관계를 끊은 것은 아니었고, 이후 VOCALOID6 하츠네 미쿠의 발표로 확인되었다.[4] 한국어와 일본어에서 쓰이는 가창이라는 의미의 '보컬'과 달리 영어의 vocal은 그냥 단순히 '음성의' 라는 뜻이기 때문에 오히려 이 쪽이 모호한 단어이고, 노래소리임을 명확히 할 필요가 있으면 Singing Voice Synthesis라고 해야 한다.[A] 5.1 5.2 5.3 TTS 겸용[8] 2024년 업데이트로 SVS 기능이 추가되었다.[9] 여긴 실시간도 된다.
![]()
이 저작물은 CC BY-NC-SA 2.0 KR에 따라 이용할 수 있습니다. (단, 라이선스가 명시된 일부 문서 및 삽화 제외)
기여하신 문서의 저작권은 각 기여자에게 있으며, 각 기여자는 기여하신 부분의 저작권을 갖습니다.
나무위키는 백과사전이 아니며 검증되지 않았거나, 편향적이거나, 잘못된 서술이 있을 수 있습니다.
나무위키는 위키위키입니다. 여러분이 직접 문서를 고칠 수 있으며, 다른 사람의 의견을 원할 경우 직접 토론을 발제할 수 있습니다.