AI μμ΄μ νΈκ° κΈ΄ μμ μμ μ μ€ν¨νλμ§λ₯Ό 체κ³μ μΌλ‘ λΆμν λ²€μΉλ§ν¬ μ°κ΅¬κ° λμμ΄μ.
HORIZONμ΄λΌλ μ΄λ¦μ ν¬λ‘μ€ λλ©μΈ μ§λ¨ λ²€μΉλ§ν¬μΈλ°μ, GPT-5 κ³μ΄κ³Ό Claude λͺ¨λΈμ ν¬ν¨ν μ΅μ μμ΄μ νΈλ€μ λμμΌλ‘ 3,100κ° μ΄μμ νλ κΆ€μ μ μμ§ν΄μ λΆμνμ΄μ. λ¨κΈ°Β·μ€κΈ° μμ μμ μ λμνλ λͺ¨λΈλ€μ΄ μ μ₯κΈ° μμ μμ 무λμ§λμ§, κ·Έ ν¨ν΄μ λλ©μΈλ³λ‘ λλ μ λ€μ¬λ€λ³Έ κ±°μμ.
ν₯λ―Έλ‘μ΄ κ±΄ νκ° λ°©μμ΄μμ. LLMμ΄ μ§μ μ€ν¨ μμΈμ νμ νλ "LLM-as-a-Judge" νμ΄νλΌμΈμ μΌλλ°, μ¬λ νκ°μλ€κ³Όμ μΌμΉμ¨μ΄ ΞΊ=0.84λ‘ κ½€ λμκ±°λ μ. μ¬λμ΄ μΌμΌμ΄ μ λ΄λ μ λ’°ν μ μλ μλνλ μ€ν¨ λΆμμ΄ κ°λ₯ν΄μ§ μ μ΄μμ.
μμ΄μ νΈ μμ€ν μ΄ λ³΅μ‘ν μ€μ μ 무λ₯Ό λ§‘κΈ° μ μ, μ΄λμ μ΄λ»κ² 무λμ§λμ§λ₯Ό λ¨Όμ μ΄ν΄ν΄μΌ νλ€λ κ±Έ μ΄ μ°κ΅¬κ° 보μ¬μ£Όκ³ μμ΄μ.