MLPerf Inference v6.0 ๋ฒค์น๋งํฌ๊ฐ ๊ณต๊ฐ๋๋๋ฐ, Nvidia๊ฐ 288๊ฐ GPU ๊ตฌ์ฑ์ผ๋ก ์ ํญ๋ชฉ ์ต๊ณ ๊ธฐ๋ก์ ์ธ์ ์ด์.
์ด๋ฒ ๋ฒ์ ์ ์ฒ์์ผ๋ก ๋ฉํฐ๋ชจ๋ฌยท๋น๋์ค ๋ชจ๋ธ ํ ์คํธ๊ฐ ์ถ๊ฐ๋๊ฑฐ๋ ์. DeepSeek-R1, GPT-OSS-120B, Qwen3-VL-235B, ํ ์คํธ-์์ ๋ณํ ๋ชจ๋ธ WAN-2.2-T2V๊น์ง 5๊ฐ ์ ๋ฒค์น๋งํฌ๊ฐ ์๊ฒผ๋๋ฐ, ์ด ๋ชจ๋ ํญ๋ชฉ์ ๊ฒฐ๊ณผ๋ฅผ ์ ์ถํ ๊ฑด Nvidia๋ฟ์ด์์.
ํนํ ๋์ ๋๋ ๊ฑด ํ๋์จ์ด ๊ต์ฒด ์์ด ์ํํธ์จ์ด ์ต์ ํ๋ง์ผ๋ก DeepSeek-R1 ์ฒ๋ฆฌ๋์ 6๊ฐ์ ์ ๋๋น 2.7๋ฐฐ ๋์ด์ฌ๋ ธ๋ค๋ ์ ์ด์์. ํ ํฐ ์์ฐ ๋น์ฉ๋ 60% ์ด์ ์ ๊ฐํ๋ค๊ณ ํด์. AMD๋ 8-GPU ๋จ์ผ ๋ ธ๋ ๋น๊ต์ ์ง์คํ๊ณ , Intel์ ์ํฌ์คํ ์ด์ GPU ์์ฅ์ ํ๊ฒ์ผ๋ก ์ผ์ ์ธ ํ์ฌ๊ฐ ์๋ก ๋ค๋ฅธ ๊ธฐ์ค์ ์์ธ์ฐ๊ณ ์์ด์.
GPU ๊ฒฝ์์ด ๋จ์ ํ๋์จ์ด ์คํ์ ๋์ด ์ํํธ์จ์ด ์ต์ ํ ์ธ์์ผ๋ก ๋์ด๊ฐ๊ณ ์๋ค๋ ๊ฑธ ๋ณด์ฌ์ฃผ๋ ๊ฒฐ๊ณผ์์.