OpenAI๊ฐ GPT-5.4 mini์ nano๋ฅผ ์ถ์ํ์ด์. ์ด์ ์ธ๋๋ณด๋ค ์ฑ๋ฅ์ ํฌ๊ฒ ์ฌ๋์ง๋ง ๊ฐ๊ฒฉ๋ ์ต๋ 4๋ฐฐ ์ฌ๋๊ฑฐ๋ ์.
GPT-5.4 mini๋ ์ฝ๋ฉ ๋ฒค์น๋งํฌ SWE-Bench Pro์์ 54.4%๋ฅผ ๊ธฐ๋กํ์ด์. ํ ๋ชจ๋ธ์ธ GPT-5.4(57.7%)์ ๊ฑฐ์ ์ฐจ์ด๊ฐ ์๋๋ฐ, ์๋๋ 2๋ฐฐ ์ด์ ๋น ๋ฅด๊ณ ์. ์ปดํจํฐ ์ ์ด ๋ฅ๋ ฅ์ ์ฌ๋ OSWorld-Verified์์๋ 72.1%๋ก, GPT-5 mini(42.0%) ๋๋น 30%p ๊ฐ๊น์ด ๋ฐ์ด์ฌ๋์ด์.
OpenAI๊ฐ ๋ฐ๊ณ ์๋ ๊ตฌ์กฐ๋ "ํฐ ๋-์์ ๋ ๋ถ์ "์ด์์. GPT-5.4๊ฐ ๊ณํยท์กฐ์จยท์ต์ข ๊ฒํ ๋ฅผ ๋งก๊ณ , ์ฝ๋๋ฒ ์ด์ค ํ์์ด๋ ๋์ฉ๋ ํ์ผ ์ค์บ ๊ฐ์ ๋จ์ ๋ฐ๋ณต ์์ ์ miniยทnano ์๋ธ์์ด์ ํธ์๊ฒ ๋๊ธฐ๋ ๋ฐฉ์์ด๊ฑฐ๋ ์. Codex์์ mini๋ GPT-5.4 ์ฟผํฐ์ 30%๋ง ์๋นํด์ ๋จ์ ์์ ๋น์ฉ์ด 3๋ถ์ 1 ์์ค์ผ๋ก ์ค์ด์.
์์ด์ ํธ ์๋์ ๋ง์ถฐ "๋น์ผ ๋ชจ๋ธ์ ํ๋จ, ์ผ ๋ชจ๋ธ์ ์คํ"์ด๋ผ๋ ๋ถ์ ๊ตฌ์กฐ๊ฐ ์ ์ ๋ช ํํด์ง๊ณ ์์ด์.