PrismML์ Bonsai 1.7B ๋ชจ๋ธ์ CUDA๋ก ์ง์ ๋๋ ค๋ณผ ์ ์๋ ํํ ๋ฆฌ์ผ์ด ๋์์ด์.
1๋นํธ ์์ํ(Q1_0_g128 ํฌ๋งท)๋ฅผ ์ ์ฉํ ๋ชจ๋ธ์ด๋ผ ๋ฉ๋ชจ๋ฆฌ ํจ์จ์ด ๊ทน๋จ์ ์ผ๋ก ๋๊ณ , llama.cpp ๊ธฐ๋ฐ์ GGUF ์คํ์ผ๋ก GPU ๊ฐ์ ์ถ๋ก ์ด ๊ฐ๋ฅํด์. ๋ฒค์น๋งํน, ๋ฉํฐํด ์ฑํ , JSON ๊ตฌ์กฐํ ์ถ๋ ฅ, ์ฝ๋ ์์ฑ, OpenAI ํธํ ์๋ฒ ๋ชจ๋, RAG ์ํฌํ๋ก์ฐ๊น์ง ํ ํํ ๋ฆฌ์ผ์์ ์ ๋ถ ๋ค๋ค์.
Google Colab ํ๊ฒฝ์์ GPU ์ฒดํฌ๋ถํฐ HuggingFace ๋ชจ๋ธ ๋ค์ด๋ก๋, llama.cpp ๋ฐ์ด๋๋ฆฌ ์ค์น๊น์ง ๋จ๊ณ๋ณ๋ก ์คํํ ์ ์๋๋ก ๊ตฌ์ฑ๋ผ ์์ด์ ์ง์ ๋ฐ๋ผ ํ๊ธฐ ์ด๋ ต์ง ์์์.
1๋นํธ LLM์ด ์ค์ ์ถ๋ก ํ์ดํ๋ผ์ธ์์ ์ด๋๊น์ง ์ธ ์ ์๋์ง ๊ฐ๋ ํด๋ณผ ์ ์๋ ์ค์ฉ์ ์ธ ์์์ ์ด์์.