๋ฏธ์คํธ๋์ด ์คํ์์ค ์์ฑ ์์ฑ ๋ชจ๋ธ โVoxtral TTSโ๋ฅผ ๋ด๋์ผ๋ฉด์ ElevenLabsยทDeepgramยทOpenAI์ ์ ๋ฉด ์น๋ถ์ ๋ค์ด๊ฐ์ด์.
์ด ๋ชจ๋ธ์ ์์ดยทํ๋์ค์ดยท๋ ์ผ์ดยท์คํ์ธ์ดยท๋ค๋๋๋์ดยทํฌ๋ฅดํฌ๊ฐ์ดยท์ดํ๋ฆฌ์์ดยทํ๋์ดยท์๋์ด๊น์ง 9๊ฐ ์ธ์ด๋ฅผ ์ง์ํด์. 5์ด ๋ฏธ๋ง ์ํ๋ง์ผ๋ก ์ปค์คํ ๋ณด์ด์ค๋ฅผ ๋ง๋ค๊ณ , ์ต์ยท๋งํฌยท๋ฏธ์ธํ ๋ฐํ ํน์ฑ๋ ์ฌํํด์ค๋ค๊ณ ํด์.
Ministral 3B ๊ธฐ๋ฐ์ ์ํ ๋ชจ๋ธ์ด๋ผ ์ค๋งํธ์์นยท์ค๋งํธํฐยท๋ ธํธ๋ถ ๊ฐ์ ์ฃ์ง ๋๋ฐ์ด์ค์์๋ ๋๋ฆด ์ ์์ด์. ์ค์๊ฐ ์ฑ๋ฅ๋ ๊ฐ์กฐํ๋๋ฐ, 500์(์ฝ 10์ด ๋ถ๋) ์ ๋ ฅ ๊ธฐ์ค TTFA 90ms, RTF 6x๋ผ 10์ด ์์ฑ์ ์ฝ 1.6์ด์ ์์ฑํด์.
์ฌํด ์ ์ฌ(Transcribe) ๋ชจ๋ธ 2์ข ์ ์ด์ด TTS๊น์ง ์ฑ์ฐ๋ฉด์, ๋ฏธ์คํธ๋์ด ์ํฐํ๋ผ์ด์ฆ์ฉ ์ข ๋จ๊ฐ ์์ฑ AI ์คํ์ ๋น ๋ฅด๊ฒ ์์ฑํด๊ฐ๋ ํ๋ฆ์ด ๋ถ๋ช ํด์ก์ด์.