llama.cppκ° Gemma 4 λͺ¨λΈμ μ€λμ€ μ²λ¦¬ κΈ°λ₯μ μΆκ°νμ΄μ. ν μ€νΈ μ μ© μΆλ‘ μμ§μμ λ©ν°λͺ¨λ¬ νλ«νΌμΌλ‘ μ§νν κ±°κ±°λ μ.
ν΅μ¬μ ν΄λΌμ°λ API μμ΄ λ‘컬 νλμ¨μ΄μμ μ€λμ€λ₯Ό μ§μ μ²λ¦¬ν μ μλ€λ μ μ΄μμ. Gemma 4μ μ€λμ€ conformer μΈμ½λλ₯Ό νμ©ν΄μ, μμ± λ©λͺ¨ λ³νμ΄λ λ‘컬 μμ± μ΄μμ€ν΄νΈλ₯Ό μ§μμ μ§μ λ릴 μ μκ² λμ΄μ.
μ¬κΈ°μ Gemma 4 31B λͺ¨λΈμ speculative decodingμΌλ‘ μ±λ₯μ΄ μ΅λ 50% ν₯μλκ³ , λ‘컬 Ollama λͺ¨λΈλ‘ μ½λ©μ μ§μνλ μ€νμμ€ CLI μμ΄μ νΈ LiteCodeλ μλ‘ λ±μ₯νμ΄μ. μ€ν μ diff 미리보기 κΈ°λ₯κΉμ§ κ°μ·κ±°λ μ.
λ‘컬 AIκ° ν μ€νΈλ₯Ό λμ΄ μ€λμ€κΉμ§ νμΌλ©΄μ, κ°μΈ νλμ¨μ΄ μμμ λμκ°λ λ©ν°λͺ¨λ¬ μμ΄μ νΈκ° νμ€λ‘ κ°κΉμμ§κ³ μμ΄μ.