์ธํฐ๋ท์ด ๋๊ฒจ๋ ์ฝ๋ฉ ์์ด์ ํธ๋ฅผ ์ธ ์ ์์ด์. llama.cpp + Gemma 4 26B ์กฐํฉ์ผ๋ก ๋งฅ์์ ์์ ์คํ๋ผ์ธ ๋ก์ปฌ ์์ด์ ํธ๋ฅผ ๊ตฌ์ถํ ์ฌ๋ก๊ฐ ๊ณต๊ฐ๋๊ฑฐ๋ ์.
Apple M1 Max(64GB) ๊ธฐ์ค์ผ๋ก Metal ๊ฐ์๋ง ์ฐ๋ฉด ์ด๋น 58ํ ํฐ์ธ๋ฐ, MTP(Multi-Token Prediction) ๋๋ํํธ ๋ชจ๋ธ์ ์ถ๊ฐํ๋ฉด ์๋๊ฐ 2๋ฐฐ๋ก ์ฌ๋ผ๊ฐ์. ๋ชจ๋ธ ํ์ผ ํฌ๊ธฐ๋ ์ฝ 16GB, ๋ฉํฐ๋ชจ๋ฌ ํ๋ก์ ํฐ๊น์ง ํฉ์ณ๋ 17GB ์์ค์ด์์.
OpenAI ํธํ API๋ก ์๋นํ๋๊น Claude Code๋ ๋ค๋ฅธ ๋๊ตฌ์์๋ ๊ทธ๋๋ก ์ฐ๊ฒฐํ ์ ์๊ณ , ์คํฌ๋ฆฐ์ท์ ๊ทธ๋๋ก ๋ฃ์ด์ "์ง๊ธ ์ด ํ๋ฉด ๊ณ ์ณ์ค" ์์ผ๋ก ์ธ ์ ์์ด์. ํด๋ผ์ฐ๋ ์์กด์์ ๋ฒ์ด๋๋ ์ค์ฉ์ ์ธ ์ ํ์ง๊ฐ ์๊ธด ๊ฑฐ์์.