title: "AI, μ€μ μ§μμ 무μμ 3%λ§ μλ²½ ν΄κ²°" description: "λ΄μ€ - μλ¬Έ κΈ°λ° μμ½ νμ" date: 2026-06-20 tags: [ai-news] source: "https://the-decoder.com/new-benchmark-exposes-how-badly-ai-struggles-with-real-knowledge-work/" sidebar: order: 0
μ λͺ©(νκΈ): AI, μ€μ μ§μμ 무μμ 3%λ§ μλ²½ ν΄κ²° μλ¬Έ μ λͺ©(μλ¬Έ): New benchmark exposes how badly AI struggles with real knowledge work μλ¬Έ: New benchmark exposes how badly AI struggles with real knowledge work μμ€: the-decoder MD νμΌ: content/2026-06-20/the-decoder-new-benchmark-exposes-how-badly-ai-struggles-with-.md
ν΅μ¬ λ΄μ©
μ΅μ λ²€μΉλ§ν¬μμ AIκ° μ€μ μ 무 κ³Όμ λ₯Ό μλ²½ν ν΄κ²°ν λΉμ¨μ λ¨ 3%μ κ·Έμ³€μ΄μ.
Artificial Analysisκ° κ³΅κ°ν AA-Briefcase λ²€μΉλ§ν¬λ μ¬λ μ€λ λ, μ΄λ©μΌ, νμλ‘, λμ©λ λ°μ΄ν° νμΌμ²λΌ νμ€μμ μ°λ μμ² κ°μ λ¨νΈ μλ£λ‘ ꡬμ±λ λ©ν°μν¬ νλ‘μ νΈμμ. 1μλ₯Ό μ°¨μ§ν Claude Fable 5λ 91κ° κ³Όμ μ€ 31κ°μμ λͺ¨λ λͺ¨λΈμ΄ 50% ν©κ²©μ μ λμ§ λͺ»νκ±°λ μ.
μ€λ ₯μ΄ λμμ§μλ‘ μ€μ μ νλ λ¬λΌμ Έμ. μ½ν λͺ¨λΈμ νμΌ νμ μ체λ₯Ό λͺ» νμ§λ§, κ°ν λͺ¨λΈμ λͺ λ°±ν μ건μ μ²λ¦¬νλ©΄μλ μ¬λ¬ λ¬Έμλ₯Ό κ΅μ°¨ν΄μΌλ§ 보μ΄λ μΈλΆ μ¬νμ λμ³μ. κ³Όμ λΉ λΉμ©λ DeepSeek V4 Flashμ $0.04λΆν° Claude Fable 5μ $31κΉμ§ 800λ°° μ΄μ μ°¨μ΄κ° λκ³ μ.
'AIκ° μΌμ λ€ ν΄μ€λ€'λ κΈ°λμ νμ€ μ¬μ΄μ κ°κ²©μ΄ μμ§ κ½€ ν¬λ€λ κ±Έ 보μ¬μ£Όλ κ²°κ³Όμμ.
μ‘λμ€μ νλ§λ
κ°ν λͺ¨λΈμΌμλ‘ 'λμ λλ μ€μ'λ μ€μ§λ§, μ¬λ¬ λ¬Έμλ₯Ό κ΅μ°¨ν΄μΌ 보μ΄λ μΈλΆ μ¬νμ λμΉλ λ μ‘°μ©ν μ€ν¨κ° λμ΄λμ.
μΆμ²: New benchmark exposes how badly AI struggles with real knowledge work