πŸ“ˆμ„±κ³΅μ‚¬λ‘€2026-06-27

λ‰΄μŠ€ - 원문 기반 μš”μ•½ ν•„μš”

πŸ’‘ ν•œμ€„ μš”μ•½|λ‰΄μŠ€ - 원문 기반 μš”μ•½ ν•„μš”


title: "AIκ°€ 19일 연속 μ½”λ”©ν•œ 벀치마크, λΉ„μš©μ€ 290λ§Œμ›" description: "λ‰΄μŠ€ - 원문 기반 μš”μ•½ ν•„μš”" date: 2026-06-27 tags: [ai-tool] source: "https://the-decoder.com/an-ai-model-programmed-nonstop-for-19-days-on-a-single-mirrorcode-task-that-cost-2600-to-run/" sidebar: order: 0

제λͺ©(ν•œκΈ€): AIκ°€ 19일 연속 μ½”λ”©ν•œ 벀치마크, λΉ„μš©μ€ 290λ§Œμ› 원문 제λͺ©(영문): An AI model programmed nonstop for 19 days on a single MirrorCode task that cost $2,600 to run 원문: An AI model programmed nonstop for 19 days on a single MirrorCode task that cost $2,600 to run μ†ŒμŠ€: the-decoder MD 파일: content/2026-06-27/the-decoder-an-ai-model-programmed-nonstop-for-19-days-on-a-si.md

핡심 λ‚΄μš©

AIκ°€ 19일 λ™μ•ˆ 쉬지 μ•Šκ³  μ½”λ”©λ§Œ ν•œ μ‹€ν—˜μ΄ κ³΅κ°œλμ–΄μš”. Epoch AI의 μƒˆ 벀치마크 MirrorCodeμ—μ„œ 단일 κ³Όμ œμ— 2,600λ‹¬λŸ¬(μ•½ 360λ§Œμ›)κ°€ μ†Œμš”λκ±°λ“ μš”.

원본 μ†ŒμŠ€μ½”λ“œ 없이 ν”„λ‘œκ·Έλž¨ 전체λ₯Ό μ²˜μŒλΆ€ν„° μž¬κ΅¬ν˜„ν•˜λŠ” 게 λ―Έμ…˜μ΄μ—μš”. λŒ€μƒ ν”„λ‘œκ·Έλž¨ 25κ°œλŠ” Unix μœ ν‹Έλ¦¬ν‹°λΆ€ν„° μ•”ν˜Έν™”, λ°”μ΄μ˜€μΈν¬λ§€ν‹±μŠ€κΉŒμ§€ λ‹€μ–‘ν•˜κ³ , λͺ¨λΈμ΄ ν•œ λ²ˆλ„ 보지 λͺ»ν•œ μˆ¨κ²¨μ§„ ν…ŒμŠ€νŠΈλ‘œ 정확도λ₯Ό νŒμ •ν•΄μš”.

Claude Opus 4.7이 μ†”λΈŒμœ¨ 56%둜 1μœ„λ₯Ό μ°¨μ§€ν–ˆμ–΄μš”. 1만 6천 μ€„μ§œλ¦¬ Go μ½”λ“œλ₯Ό 14μ‹œκ°„μ— μž¬κ΅¬ν˜„ν•œ 게 λŒ€ν‘œ 사둀인데, μ‚¬λžŒ μ—”μ§€λ‹ˆμ–΄λΌλ©΄ 2~17μ£Ό 걸릴 μž‘μ—…μ΄μ—μš”.

λ‹€λ§Œ κ°€μž₯ λ³΅μž‘ν•œ κ³Όμ œλŠ” μ–΄λ–€ λͺ¨λΈλ„ 아직 λͺ» ν’€μ–΄μš”. AI μ½”λ”© λŠ₯λ ₯이 λΉ λ₯΄κ²Œ μ„±μž₯ν•˜κ³  μžˆμ§€λ§Œ, 'μ™„μ „ 자율 개발'κΉŒμ§„ 아직 거리가 μžˆλ‹€λŠ” κ±Έ λ³΄μ—¬μ£ΌλŠ” μ§€ν‘œμ˜ˆμš”.

작돌쌀의 ν•œλ§ˆλ””

Claude Opus 4.7이 56%둜 1μœ„μ§€λ§Œ κ°€μž₯ λ³΅μž‘ν•œ κ³Όμ œλŠ” λͺ¨λ“  λͺ¨λΈμ΄ μ‹€νŒ¨ν•΄μš”. 자율 κ°œλ°œκΉŒμ§„ 아직 갈 길이 남아 μžˆμ–΄μš”.


좜처: An AI model programmed nonstop for 19 days on a single MirrorCode task that cost $2,600 to run

이 글이 μ–΄λ• λ‚˜μš”?