์ ๋ชฉ(ํ๊ธ): NVIDIA, ARยทํ์ฐยท์๊ธฐ์ถ์ธก 3๋ชจ๋ ์ธ์ด๋ชจ๋ธ ๊ณต๊ฐ ์๋ฌธ ์ ๋ชฉ(์๋ฌธ): NVIDIA AI Releases Nemotron-Labs-Diffusion: A Tri-Mode Language Model with 6ร Tokens Per Forward Over Qwen3-8B ์๋ฌธ: NVIDIA AI Releases Nemotron-Labs-Diffusion: A Tri-Mode Language Model with 6ร Tokens Per Forward Over Qwen3-8B ์์ค: marktechpost MD ํ์ผ: content/2026-05-21/marktechpost-nvidia-ai-releases-nemotron-labs-diffusion-a-tri-m.md
ํต์ฌ ๋ด์ฉ
NVIDIA๊ฐ ํ๋์ ๊ฐ์ค์น๋ก ์ธ ๊ฐ์ง ์ถ๋ก ๋ฐฉ์์ ์ง์ํ๋ ์ธ์ด๋ชจ๋ธ ํจ๋ฐ๋ฆฌ Nemotron-Labs-Diffusion์ ๊ณต๊ฐํ์ด์.
๊ธฐ์กด ์๋ํ๊ท(AR) ๋ฐฉ์์ ํ ํฐ์ ํ ๋ฒ์ ํ๋์ฉ ์์ฑํด GPU ๋ณ๋ ฌ์ฑ ํ์ฉ์ด ๋ฎ์๋๋ฐ์. ์ด ๋ชจ๋ธ์ ARยทํ์ฐ(Diffusion)ยท์๊ธฐ์ถ์ธก(Self-Speculation) ์ธ ๊ฐ์ง ๋ชจ๋๋ฅผ ์ํฉ์ ๋ฐ๋ผ ์ ํํด์ ์จ์. ํ์ฐ ๋ชจ๋์์๋ ํ ๋ฒ์ ์์ ํ(forward pass)๋ก Qwen3-8B ๋๋น ์ต๋ 6๋ฐฐ ๋ง์ ํ ํฐ์ ์ฒ๋ฆฌํ ์ ์์ด์.
3Bยท8Bยท14B ์ธ ๊ฐ์ง ํ๋ผ๋ฏธํฐ ํฌ๊ธฐ๋ก ์ ๊ณต๋๊ณ , ๊ธฐ๋ณธยท์ธ์คํธ๋ญํธยท๋น์ -์ธ์ด ๋ณํ๊น์ง ํฌํจ๋ผ ์์ด์. ์ถ๋ก ์๋์ ์ ํ๋๋ฅผ ๋์์ ์ก์ผ๋ ค๋ ์๋๊ฐ ์ค์ ๋ฐฐํฌ ํ๊ฒฝ์์ ์ด๋ค ๊ฒฐ๊ณผ๋ฅผ ๋ผ์ง ์ฃผ๋ชฉ๋ผ์.
์ก๋์ค์ ํ๋ง๋
ํ์ฐ ๋ชจ๋์์ ์์ ํ 1ํ๋น Qwen3-8B๋ณด๋ค ์ต๋ 6๋ฐฐ ๋ง์ ํ ํฐ์ ์ฒ๋ฆฌํด์. ์ฃ์งยท๋จ์ผ ์ฌ์ฉ์ ํ๊ฒฝ์์ GPU ํ์ฉ๋ฅ ์ ํฌ๊ฒ ๋์ผ ์ ์์ด์.