OpenAI ์ฐ๊ตฌ์ง์ด Instruction Hierarchy ํ์ต์ฉ ๋ฐ์ดํฐ์ IH-Challenge๋ฅผ ๊ณต๊ฐํ๊ณ , GPT-5-Mini์ ๊ณ์ธต ์ง์ ์ค์ ๊ฐ๊ฑด์ฑ์ ํ๊ท +10.0% ๋์ด์ฌ๋ ธ์ด์.
์์คํ ยท๊ฐ๋ฐ์ยท์ฌ์ฉ์ยท๋๊ตฌ ์ง์๊ฐ ์ถฉ๋ํ ๋ ์ฐ์ ์์๋ฅผ ์งํค๋ ๋ฅ๋ ฅ์ด ํต์ฌ์ธ๋ฐ, ์ด๊ฒ jailbreakยท์์คํ ํ๋กฌํํธ ์ถ์ถยท์์ด์ ํธ ํ๋กฌํํธ ์ธ์ ์ ๋ฐฉ์ด์ ๊ธฐ๋ฐ์ด๊ฑฐ๋ ์.
์จ๋ผ์ธ ์ ๋์ ์์ ์์ฑ์ผ๋ก ํ์ธํ๋ํ ๊ฒฐ๊ณผ, 16๊ฐ ๋ฒค์น๋งํฌ์์ 84.1%โ94.1%๋ก ๊ฐ์ ๋๊ณ unsafe ๋น์จ์ 6.6%โ0.7%๋ก ์ค์์ด์. ์ผ๋ฐ ์์ ์ฑ ํ๊ฐ์ ์ ์ฉ์ฑ์ ์คํ๋ ค ์ข์์ก๊ณ ์ฑ๋ฅ ์ ํ๋ ์ต์์์ด์.
๊ฒฐ๊ตญ โ๋ฌด์กฐ๊ฑด ๊ฑฐ์ โ์ด ์๋๋ผ ์ง์ ๊ณ์ธต์ ์ ํํ ํด์ํ๋ ์ ๋ ฌ ํ์ต์ด ์ค์ ๋ณด์ ํ์ง์ ์ข์ฐํ๋ค๋ ์ ํธ์์.