OpenAI μ°κ΅¬μ§μ΄ Instruction Hierarchy νμ΅μ© λ°μ΄ν°μ IH-Challengeλ₯Ό 곡κ°νκ³ , GPT-5-Miniμ κ³μΈ΅ μ§μ μ€μ κ°κ±΄μ±μ νκ· +10.0% λμ΄μ¬λ Έμ΄μ.
μμ€ν Β·κ°λ°μΒ·μ¬μ©μΒ·λꡬ μ§μκ° μΆ©λν λ μ°μ μμλ₯Ό μ§ν€λ λ₯λ ₯μ΄ ν΅μ¬μΈλ°, μ΄κ² jailbreakΒ·μμ€ν ν둬ννΈ μΆμΆΒ·μμ΄μ νΈ ν둬ννΈ μΈμ μ λ°©μ΄μ κΈ°λ°μ΄κ±°λ μ.
μ¨λΌμΈ μ λμ μμ μμ±μΌλ‘ νμΈνλν κ²°κ³Ό, 16κ° λ²€μΉλ§ν¬μμ 84.1%β94.1%λ‘ κ°μ λκ³ unsafe λΉμ¨μ 6.6%β0.7%λ‘ μ€μμ΄μ. μΌλ° μμ μ± νκ°μ μ μ©μ±μ μ€νλ € μ’μμ‘κ³ μ±λ₯ μ νλ μ΅μμμ΄μ.
κ²°κ΅ β무쑰건 κ±°μ βμ΄ μλλΌ μ§μ κ³μΈ΅μ μ νν ν΄μνλ μ λ ¬ νμ΅μ΄ μ€μ 보μ νμ§μ μ’μ°νλ€λ μ νΈμμ.