๐ก ํ์ค ์์ฝ: OpenAI๊ฐ ์ฝ๋ฉ๊ณผ ์ ๋ฌธ ์ถ๋ก ๋ฅ๋ ฅ์ ํตํฉํ GPT-5.3-Codex ๋ชจ๋ธ์ ์ถ์ํ์ต๋๋ค. ์ด์ ๋ชจ๋ธ๋ณด๋ค 25% ๋นจ๋ผ์ก์ผ๋ฉฐ, SWE-Bench Pro์ Terminal-Bench 2.0์์ ์ต๊ณ ์ฑ๋ฅ์ ๊ธฐ๋กํ๊ณ , ์ค์ ๋ก OpenAI๊ฐ ์ด ๋ชจ๋ธ์ ๊ฐ๋ฐํ๊ณ ๋ฐฐํฌํ๋ ๊ณผ์ ์ ์ฌ์ฉ๋์๋ค๊ณ ํฉ๋๋ค.
๋ฐฐ๊ฒฝ
OpenAI๊ฐ GPT-5.3-Codex๋ฅผ ๊ณต๊ฐํ์ต๋๋ค. ๊ธฐ์กด ๋ชจ๋ธ๋ค์ด '์ฝ๋ฉ'์๋ง ํนํ๋์๋ค๋ฉด, ์ด๋ฒ ๋ชจ๋ธ์ "Professional Reasoning(์ ๋ฌธ์ ์ถ๋ก )" ๋ฅ๋ ฅ์ ํตํฉํ์ฌ ์ฝ๋ฉ๋ฟ๋ง ์๋๋ผ ๊ธฐํ, ๋๋ฒ๊น , ์ฌ์ฉ์ ๋ฆฌ์์น ๋ฑ ์ํํธ์จ์ด ๋ผ์ดํ์ฌ์ดํด ์ ๋ฐ์ ๋ค๋ฃฐ ์ ์๋ ๋ง๋ฅ ์์ด์ ํธ๋ก ์งํํ์ต๋๋ค. ํนํ ๋๋ผ์ด ์ ์ "Instrumental in creating itself"๋ผ๋ ํํ์ธ๋ฐ์, OpenAI ์ฐ๊ตฌํ์ด ์ด ๋ชจ๋ธ์ ๊ฐ๋ฐํ๊ณ ํ์ต์ํค๋ ๊ณผ์ ์์ ์ด๊ธฐ ๋ฒ์ ์ GPT-5.3-Codex๋ฅผ ์ฌ์ฉํ์ฌ ๋๋ฒ๊น ๊ณผ ์ธํ๋ผ ๊ด๋ฆฌ๋ฅผ ์ํํ๋ค๋ ๊ฒ์ ๋๋ค.
๐ ํต์ฌ ์ ๋ฆฌ
- ์๋ ํฅ์: ์ธํ๋ผ ์ต์ ํ๋ฅผ ํตํด ์ด์ ๋ณด๋ค 25% ๋ ๋น ๋ฅด๊ฒ ๋์ํฉ๋๋ค.
- ์๋์ ๋ฒค์น๋งํฌ:
- SWE-Bench Pro: 56.8% (์ต๊ณ ๊ธฐ๋ก)
- Terminal-Bench 2.0: 77.3% (ํฐ๋ฏธ๋ ์ฌ์ฉ ๋ฅ๋ ฅ ์๋์ )
- OSWorld-Verified: 64.7% (๋ฐ์คํฌํฑ ํ๊ฒฝ์์์ ์ปดํจํฐ ์ ์ด ๋ฅ๋ ฅ)
- ์๊ธฐ ์งํ: ๋ชจ๋ธ์ด ์์ ์ ํ์ต ๊ณผ์ ์ ๋ชจ๋ํฐ๋งํ๊ณ , ๋ฐ์ดํฐ ํ์ดํ๋ผ์ธ์ ๊ตฌ์ถํ๊ณ , ์๋ฒ ์ฅ์ ์์ธ์ ๋ถ์ํ๋ ๋ฐ ์ฌ์ฉ๋์์ต๋๋ค.
- ์ฌ์ด๋ฒ ๋ณด์: OpenAI ๋ชจ๋ธ ์ต์ด๋ก ์ฌ์ด๋ฒ ๋ณด์ ์ ๋ฌด์ "High capability" ๋ฑ๊ธ์ ๋ฐ์์ผ๋ฉฐ, ์ทจ์ฝ์ ํ์ง ํ๋ จ์ด ๋์ด ์์ต๋๋ค.
MAX5์ ์๊ฐ ๐ฏ
๐จโ๐ป ๋ฐ์ด๋ธ ์ฝ๋ฉ ๋ ์ํผ
GPT-5.3-Codex๋ "ํฐ๋ฏธ๋์ ์ ์ฐ๋ ์์ด์ ํธ"์ ๋๋ค. Terminal-Bench ์ ์๊ฐ 77.3%๋ผ๋ ๊ฒ์, ๋ณต์กํ CLI ๋ช ๋ น์ด๋ฅผ ์์ ์์ฌ๋ก ๋ค๋ฃฌ๋ค๋ ๋ป์ ๋๋ค.
์ถ์ฒ ์ํฌํ๋ก์ฐ: Codex ์ฑ์ด๋ ํฐ๋ฏธ๋ ํ๊ฒฝ์์ ๋ค์๊ณผ ๊ฐ์ด ๋ช ๋ นํด ๋ณด์ธ์.
# ๋ณต์กํ ๋ฐฐํฌ ํ์ดํ๋ผ์ธ ๋๋ฒ๊น
@terminal ํ์ฌ CI/CD ํ์ดํ๋ผ์ธ ๋ก๊ทธ๋ฅผ ๋ถ์ํด์, ์ ๋น๋๊ฐ 50% ํ๋ฅ ๋ก ์คํจํ๋์ง ์์ธ์ ์ฐพ์์ค.
์ง์ ๋ก๊ทธ ํ์ผ์ grepํด์ ํจํด์ ์ฐพ๊ณ , ์์ฌ๋๋ ์ค์ ํ์ผ์ ์์ ํด์ PR์ ๋ง๋ค์ด์ค.
๋จ์ํ "์ฝ๋๋ฅผ ์ง์ค"๊ฐ ์๋๋ผ, "๋ก๊ทธ๋ฅผ ๋ค์ ธ์(grep) ์์ธ์ ์ฐพ๊ณ (reasoning) ๊ณ ์ณ๋ผ(edit)"๋ผ๋ ์์ด์ ํธ์ค๋ฌ์ด ์ง์๋ฅผ ๊ฐ์ฅ ์ ์ํํ ๊ฒ์ ๋๋ค.
๐ธ ์ฌ์ด๋ ํ๋ก์ ํธ ์์ด๋์ด
"GitHub Issue ์๋ ํด๊ฒฐ ๋ด" GPT-5.3-Codex์ SWE-Bench ์ฑ๋ฅ(56.8%)์ ํ์ฉํด, ์คํ์์ค ํ๋ก์ ํธ๋ ์ฌ๋ด ๋ฆฌํฌ์งํ ๋ฆฌ์ ์ด์๋ฅผ ์๋์ผ๋ก ํด๊ฒฐํ๊ณ PR์ ๋ ๋ฆฌ๋ ์๋น์ค๋ฅผ ๋ง๋ค ์ ์์ต๋๋ค.
- ๊ธฐ๋ฅ: ์ด์๊ฐ ๋ฑ๋ก๋๋ฉด -> ๊ด๋ จ ์ฝ๋๋ฅผ ์ฐพ๊ณ -> ์ฌํ ํ ์คํธ๋ฅผ ๋ง๋ค๊ณ -> ์ฝ๋๋ฅผ ์์ ํด์ -> PR ์์ฑ
- ์ฐจ๋ณ์ : ๋จ์ ์ฝ๋ ์์ ์ด ์๋๋ผ, ํฐ๋ฏธ๋์ ์ฌ์ฉํด ํ ์คํธ๋ฅผ ์ง์ ๋๋ ค๋ณด๊ณ ํต๊ณผํ ์ฝ๋๋ง PR๋ก ์ฌ๋ฆฌ๋ "๊ฒ์ฆ๋ ์์ด์ ํธ" ์๋น์ค