2026-04-20

GPT-5.4, Claude Opus 4.6κ³Ό λΉ„μŠ·ν•œ 벀치마크 μ„±λŠ₯을 λ‚΄λ©΄μ„œλ„ λˆ„κ΅¬λ‚˜ λ‹€μš΄λ‘œλ“œν•΄μ„œ μ“Έ 수 μžˆκ±°λ“ μš”

πŸ’‘ ν•œμ€„ μš”μ•½|GPT-5.4, Claude Opus 4.6κ³Ό λΉ„μŠ·ν•œ 벀치마크 μ„±λŠ₯을 λ‚΄λ©΄μ„œλ„ λˆ„κ΅¬λ‚˜ λ‹€μš΄λ‘œλ“œν•΄μ„œ μ“Έ 수 μžˆκ±°λ“ μš”.

Moonshot AIκ°€ μ˜€ν”ˆμ›¨μ΄νŠΈ λͺ¨λΈ Kimi K2.6을 κ³΅κ°œν–ˆμ–΄μš”. GPT-5.4, Claude Opus 4.6κ³Ό λΉ„μŠ·ν•œ 벀치마크 μ„±λŠ₯을 λ‚΄λ©΄μ„œλ„ λˆ„κ΅¬λ‚˜ λ‹€μš΄λ‘œλ“œν•΄μ„œ μ“Έ 수 μžˆκ±°λ“ μš”.

κ°€μž₯ λˆˆμ— λ„λŠ” κΈ°λŠ₯은 'μ—μ΄μ „νŠΈ μŠ€μ›œ'μ΄μ—μš”. μ΅œλŒ€ 300개의 μ„œλΈŒ μ—μ΄μ „νŠΈλ₯Ό λ™μ‹œμ— 돌릴 수 있고, 각 μ—μ΄μ „νŠΈλŠ” μ΅œλŒ€ 4,000λ‹¨κ³„κΉŒμ§€ μž‘μ—…ν•  수 μžˆμ–΄μš”. SWE-Bench Pro 58.6, HLE with Tools 54.0, BrowseComp 83.2둜, μ½”λ”©Β·μ—μ΄μ „νŠΈ λ²€μΉ˜λ§ˆν¬μ—μ„œ μ΅œμƒμœ„κΆŒμ— λ“€μ–΄μš”.

λΌμ΄μ„ μŠ€λŠ” μˆ˜μ •λœ MIT 방식인데, μ›”κ°„ ν™œμ„± μ‚¬μš©μž 1μ–΅ λͺ… μ΄μƒμ΄κ±°λ‚˜ μ›” 맀좜 2,000만 λ‹¬λŸ¬ 이상인 상업 μ œν’ˆμ—μ„œ μ“Έ κ²½μš°μ—” UI에 'Kimi K2.6' ν¬λ ˆλ”§μ„ ν‘œμ‹œν•΄μ•Ό ν•΄μš”. κ·Έ μ΄ν•˜ 규λͺ¨λΌλ©΄ 사싀상 자유둭게 μ“Έ 수 μžˆλŠ” κ±°μ˜ˆμš”.

ν΄λ‘œμ¦ˆλ“œ λͺ¨λΈ μ „μš©μ΄λ˜ λŒ€κ·œλͺ¨ μ—μ΄μ „νŠΈ μŠ€μ›œ κΈ°λŠ₯이 μ˜€ν”ˆμ›¨μ΄νŠΈλ‘œ ν’€λ¦° μ…ˆμ΄λΌ, μ†Œκ·œλͺ¨ νŒ€μ΄λ‚˜ 개인 κ°œλ°œμžλ„ λ³΅μž‘ν•œ λ©€ν‹° μ—μ΄μ „νŠΈ νŒŒμ΄ν”„λΌμΈμ„ 직접 ꡬ좕할 수 μžˆλŠ” 문이 μ—΄λ Έμ–΄μš”.

이 글이 μ–΄λ• λ‚˜μš”?