2026-06-13

llama.cpp + Gemma 4 26B ์กฐํ•ฉ์œผ๋กœ ๋งฅ์—์„œ ์™„์ „ ์˜คํ”„๋ผ์ธ ๋กœ์ปฌ ์—์ด์ „ํŠธ๋ฅผ ๊ตฌ์ถ•ํ•œ ์‚ฌ๋ก€๊ฐ€ ๊ณต๊ฐœ๋๊ฑฐ๋“ ์š”

๐Ÿ’ก ํ•œ์ค„ ์š”์•ฝ|llama.cpp + Gemma 4 26B ์กฐํ•ฉ์œผ๋กœ ๋งฅ์—์„œ ์™„์ „ ์˜คํ”„๋ผ์ธ ๋กœ์ปฌ ์—์ด์ „ํŠธ๋ฅผ ๊ตฌ์ถ•ํ•œ ์‚ฌ๋ก€๊ฐ€ ๊ณต๊ฐœ๋๊ฑฐ๋“ ์š”.

์ธํ„ฐ๋„ท์ด ๋Š๊ฒจ๋„ ์ฝ”๋”ฉ ์—์ด์ „ํŠธ๋ฅผ ์“ธ ์ˆ˜ ์žˆ์–ด์š”. llama.cpp + Gemma 4 26B ์กฐํ•ฉ์œผ๋กœ ๋งฅ์—์„œ ์™„์ „ ์˜คํ”„๋ผ์ธ ๋กœ์ปฌ ์—์ด์ „ํŠธ๋ฅผ ๊ตฌ์ถ•ํ•œ ์‚ฌ๋ก€๊ฐ€ ๊ณต๊ฐœ๋๊ฑฐ๋“ ์š”.

Apple M1 Max(64GB) ๊ธฐ์ค€์œผ๋กœ Metal ๊ฐ€์†๋งŒ ์“ฐ๋ฉด ์ดˆ๋‹น 58ํ† ํฐ์ธ๋ฐ, MTP(Multi-Token Prediction) ๋“œ๋ž˜ํ”„ํŠธ ๋ชจ๋ธ์„ ์ถ”๊ฐ€ํ•˜๋ฉด ์†๋„๊ฐ€ 2๋ฐฐ๋กœ ์˜ฌ๋ผ๊ฐ€์š”. ๋ชจ๋ธ ํŒŒ์ผ ํฌ๊ธฐ๋Š” ์•ฝ 16GB, ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ”„๋กœ์ ํ„ฐ๊นŒ์ง€ ํ•ฉ์ณ๋„ 17GB ์ˆ˜์ค€์ด์—์š”.

OpenAI ํ˜ธํ™˜ API๋กœ ์„œ๋น™ํ•˜๋‹ˆ๊นŒ Claude Code๋‚˜ ๋‹ค๋ฅธ ๋„๊ตฌ์—์„œ๋„ ๊ทธ๋Œ€๋กœ ์—ฐ๊ฒฐํ•  ์ˆ˜ ์žˆ๊ณ , ์Šคํฌ๋ฆฐ์ƒท์„ ๊ทธ๋Œ€๋กœ ๋„ฃ์–ด์„œ "์ง€๊ธˆ ์ด ํ™”๋ฉด ๊ณ ์ณ์ค˜" ์‹์œผ๋กœ ์“ธ ์ˆ˜ ์žˆ์–ด์š”. ํด๋ผ์šฐ๋“œ ์˜์กด์—์„œ ๋ฒ—์–ด๋‚˜๋Š” ์‹ค์šฉ์ ์ธ ์„ ํƒ์ง€๊ฐ€ ์ƒ๊ธด ๊ฑฐ์˜ˆ์š”.

์ด ๊ธ€์ด ์–ด๋• ๋‚˜์š”?

๊ด€๋ จ ๊ธ€

ํ•ต์‹ฌ์€ '๋ฐ˜๋ณต ์ž‘์—… ์ž๋™ํ™”'์˜ˆ์š”

ํ•ต์‹ฌ์€ '๋ฐ˜๋ณต ์ž‘์—… ์ž๋™ํ™”'์˜ˆ์š”.

์žก๋Œ์Œค2๋ถ„ ์†Œ์š”

๋ฌธ์ œ๋Š” ๊ทœ์น™ ์ž์ฒด๊ฐ€ ์—†๋‹ค๋Š” ๊ฑฐ์˜ˆ์š”

๋ฌธ์ œ๋Š” ๊ทœ์น™ ์ž์ฒด๊ฐ€ ์—†๋‹ค๋Š” ๊ฑฐ์˜ˆ์š”.

์žก๋Œ์Œค2๋ถ„ ์†Œ์š”

/fusion ๋ช…๋ น์–ด๋ฅผ ์‹คํ–‰ํ•˜๋ฉด ์ตœ๋Œ€ 5๊ฐœ์˜ ํ”Œ๋ž˜๋„ˆ ๋ชจ๋ธ์ด ๋ณ‘๋ ฌ๋กœ ๊ณ„ํš์„ ์„ธ์šฐ๊ณ , ๋ฉ”์ธ ๋ชจ๋ธ์ด ์‹ค์ œ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•œ ๋’ค, ์ตœ๋Œ€ 5๊ฐœ์˜ ๋ฆฌ๋ทฐ์–ด ๋ชจ๋ธ์ด ๊ฒฐ๊ณผ๋ฌผ์„ ๊ฒ€ํ† ํ•˜๋Š” ๊ตฌ์กฐ๊ฑฐ๋“ ์š”

/fusion ๋ช…๋ น์–ด๋ฅผ ์‹คํ–‰ํ•˜๋ฉด ์ตœ๋Œ€ 5๊ฐœ์˜ ํ”Œ๋ž˜๋„ˆ ๋ชจ๋ธ์ด ๋ณ‘๋ ฌ๋กœ ๊ณ„ํš์„ ์„ธ์šฐ๊ณ , ๋ฉ”์ธ ๋ชจ๋ธ์ด ์‹ค์ œ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•œ ๋’ค, ์ตœ๋Œ€ 5๊ฐœ์˜ ๋ฆฌ๋ทฐ์–ด ๋ชจ๋ธ์ด ๊ฒฐ๊ณผ๋ฌผ์„ ๊ฒ€ํ† ํ•˜๋Š” ๊ตฌ์กฐ๊ฑฐ๋“ ์š”.

์žก๋Œ์Œค2๋ถ„ ์†Œ์š”