2B ๋ก์ปฌ ๋ชจ๋ธ์ด ์ํฐํฐ ์ถ์ถ์์ F1 0.645๋ฅผ ๊ธฐ๋กํ์ด์. ๋ฏธ๋PC ํ๊ฒฝ์์๋ GPT-4 ๋์ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ค ๋ฒค์น๋งํฌ ๊ฒฐ๊ณผ๊ฑฐ๋ ์.
ํ
์คํธ๋ ํ
์คํธ 15๊ฑด(์คํ์ธ์ด+์์ด ๋
ธํธ/๋ฉ์ผ/์ผ๊ธฐ)๊ณผ ์ฌ์ง 10์ฅ์ผ๋ก ์งํ๋๊ณ , ๋ชจ๋ธ์ qwen3-vl:2b-instruct-q4_K_M 4๋นํธ ์์ํ ๋ฒ์ ์ด์์. Ollama์์ CPU๋ก ์ผ์ด์ค๋น 2~4์ด, JSON ํ์ฑ ์ค๋ฅ๋ 0๊ฑด์ด์์ด์.
์ธ๋ถ ์ฑ๋ฅ์ ์ฌ๋๋ช F1 ์ฝ 0.87๋ก ๊ฐ์ฅ ๊ฐํ๊ณ , ์์น 0.72, ํ๋ก์ ํธ 0.65, ํ ํฝ 0.30 ์์ด์์ด์. ๋งค์นญ์ qwen3-embedding 1024์ฐจ์, ์๊ณ๊ฐ 0.75 ์ ์ฌ๋ ๊ธฐ๋ฐ์ด๋ผ ๋ฌธ๊ตฌ๊ฐ ์กฐ๊ธ ๋ฌ๋ผ๋ ๊ฐ์ ์ํฐํฐ๋ก ์ก์์ด์.
๊ฒฐ๊ตญ ํต์ฌ์ ํ๋ ๋ชจ๋ธ๋ก ์ด๋ฏธ์ง ์ค๋ช ๊ณผ ํ ์คํธ ์ถ์ถ์ ํจ๊ป ์ฒ๋ฆฌํ๋ฉด์ RAM ์ฌ์ฉ์ ์ค์๋ค๋ ์ ์ด์์. ์จ๋๋ฐ์ด์ค ๊ฐ์ธ ์ง์๊ทธ๋ํ ๊ตฌํ์ด ํ์ค๊ถ์ผ๋ก ๋ค์ด์จ ์ ํธ์์.