2026-05-29

์—์ด์ „ํ‹ฑ ์ฝ”๋”ฉ(SWE-Bench Pro)์€ 69.2%๋กœ Opus 4.7์˜ 64.3%, GPT-5.5์˜ 58.6%๋ณด๋‹ค ๋†’์•˜์–ด์š”

๐Ÿ’ก ํ•œ์ค„ ์š”์•ฝ|์—์ด์ „ํ‹ฑ ์ฝ”๋”ฉ(SWE-Bench Pro)์€ 69.2%๋กœ Opus 4.7์˜ 64.3%, GPT-5.5์˜ 58.6%๋ณด๋‹ค ๋†’์•˜์–ด์š”.

Anthropic์ด Claude Opus 4.8์„ ๊ณต๊ฐœํ–ˆ๊ณ , ๋Œ€๋ถ€๋ถ„ ๋ฒค์น˜๋งˆํฌ์—์„œ GPT-5.5์™€ Gemini 3.1 Pro๋ฅผ ์•ž์„ฐ์–ด์š”.

์—์ด์ „ํ‹ฑ ์ฝ”๋”ฉ(SWE-Bench Pro)์€ 69.2%๋กœ Opus 4.7์˜ 64.3%, GPT-5.5์˜ 58.6%๋ณด๋‹ค ๋†’์•˜์–ด์š”. Humanity's Last Exam์€ ๋„๊ตฌ ์—†์ด 49.8%, ๋„๊ตฌ ์‚ฌ์šฉ ์‹œ 57.9%๋กœ ์ตœ๊ณ  ์ ์ˆ˜๋ฅผ ๊ธฐ๋กํ–ˆ์–ด์š”.

Anthropic์€ ํŠนํžˆ ์ •์ง์„ฑ ๊ฐœ์„ ์„ ๊ฐ•์กฐํ–ˆ์–ด์š”. ์ดˆ๊ธฐ ํ…Œ์Šคํ„ฐ ๊ธฐ์ค€์œผ๋กœ ๋ถˆํ™•์‹ค์„ฑ์„ ๋” ์ž์ฃผ ๋ฐํžˆ๊ณ , ๊ทผ๊ฑฐ ์—†๋Š” ์ฃผ์žฅ๋„ ์ค„์—ˆ๊ณ ์š”. ์ž์ฒด ์ฝ”๋”ฉ ํ‰๊ฐ€์—์„  ๋ฒ„๊ทธ๋ฅผ ๊ทธ๋ƒฅ ๋„˜๊ธฐ๋Š” ๋น„์œจ์ด 4.7 ๋Œ€๋น„ ์•ฝ 4๋ฐฐ ๊ฐ์†Œํ–ˆ๋‹ค๊ณ  ๋ฐํ˜”์–ด์š”.

๋ชจ๋ธ ์„ฑ๋Šฅ๋„ ํฌ์ง€๋งŒ, ํ•œ ์„ธ์…˜์—์„œ ์ˆ˜๋ฐฑ ๊ฐœ ๋ณ‘๋ ฌ ์„œ๋ธŒ์—์ด์ „ํŠธ๋ฅผ ๋Œ๋ฆฌ๋Š” ๋™์  ์›Œํฌํ”Œ๋กœ์šฐ๊ฐ€ ์‹ค์ œ ์—…๋ฌด ์ž๋™ํ™”์˜ ์ฒด๊ฐ ๋ณ€ํ™”๋ฅผ ํ‚ค์šธ ํฌ์ธํŠธ์˜ˆ์š”.

์ด ๊ธ€์ด ์–ด๋• ๋‚˜์š”?

๊ด€๋ จ ๊ธ€

AI ์—์ด์ „ํŠธ๊ฐ€ ์ถ”๋ก  ์‹œ์ ์— ์‹ค์‹œ๊ฐ„ ๋ฐ์ดํ„ฐ๋ฅผ ์ง์ ‘ ๋Œ์–ด์˜ฌ ์ˆ˜ ์žˆ๊ฒŒ ๋œ ๊ฑฐ์˜ˆ์š”

AI ์—์ด์ „ํŠธ๊ฐ€ ์ถ”๋ก  ์‹œ์ ์— ์‹ค์‹œ๊ฐ„ ๋ฐ์ดํ„ฐ๋ฅผ ์ง์ ‘ ๋Œ์–ด์˜ฌ ์ˆ˜ ์žˆ๊ฒŒ ๋œ ๊ฑฐ์˜ˆ์š”.

์žก๋Œ์Œค2๋ถ„ ์†Œ์š”

๋ฐ”์ด๋ธŒ ์ฝ”๋”ฉ์€ ์ง๊ด€๊ณผ ์ฆ‰ํฅ์  ์š”๊ตฌ์‚ฌํ•ญ์œผ๋กœ ๋น ๋ฅด๊ฒŒ ๊ตฌํ˜„ํ•˜๋Š” ๋ฐฉ์‹์ด๊ณ , ์ŠคํŽ™ ์ฝ”๋”ฉ์€ ์ฝ”๋“œ ํ•œ ์ค„ ์“ฐ๊ธฐ ์ „์— ๋ฌธ์„œํ™”์™€ ์„ค๊ณ„๋ฅผ ๋จผ์ € ๋๋‚ด๋Š” ๋ฐฉ์‹์ด์—์š”

๋ฐ”์ด๋ธŒ ์ฝ”๋”ฉ์€ ์ง๊ด€๊ณผ ์ฆ‰ํฅ์  ์š”๊ตฌ์‚ฌํ•ญ์œผ๋กœ ๋น ๋ฅด๊ฒŒ ๊ตฌํ˜„ํ•˜๋Š” ๋ฐฉ์‹์ด๊ณ , ์ŠคํŽ™ ์ฝ”๋”ฉ์€ ์ฝ”๋“œ ํ•œ ์ค„ ์“ฐ๊ธฐ ์ „์— ๋ฌธ์„œํ™”์™€ ์„ค๊ณ„๋ฅผ ๋จผ์ € ๋๋‚ด๋Š” ๋ฐฉ์‹์ด์—์š”.

์žก๋Œ์Œค2๋ถ„ ์†Œ์š”

๋ฃจ์นด ๊ณผ๋‹ค๋‹ˆ๋…ธ ๊ฐ๋…์ด ๋ฉ”๊ฐ€ํฐ์„ ์žก๊ณ  ์•ค๋“œ๋ฃจ ๊ฐ€ํ•„๋“œ๊ฐ€ ์ƒ˜ ์•ŒํŠธ๋งŒ ์—ญ์„ ๋งก์€ ์ž‘ํ’ˆ์ธ๋ฐ์š”

๋ฃจ์นด ๊ณผ๋‹ค๋‹ˆ๋…ธ ๊ฐ๋…์ด ๋ฉ”๊ฐ€ํฐ์„ ์žก๊ณ  ์•ค๋“œ๋ฃจ ๊ฐ€ํ•„๋“œ๊ฐ€ ์ƒ˜ ์•ŒํŠธ๋งŒ ์—ญ์„ ๋งก์€ ์ž‘ํ’ˆ์ธ๋ฐ์š”.

์žก๋Œ์Œค2๋ถ„ ์†Œ์š”