2026-05-26

λ‰΄μŠ€ - 원문 기반 μš”μ•½ ν•„μš”

πŸ’‘ ν•œμ€„ μš”μ•½|λ‰΄μŠ€ - 원문 기반 μš”μ•½ ν•„μš”

제λͺ©(ν•œκΈ€): 둜컬 LLM μ…‹μ—… κ°€μ΄λ“œ v40 핡심 정리 원문 제λͺ©(영문): 둜컬 LLM μ…‹μ—… κ°€μ΄λ“œ (v40) 원문: 둜컬 LLM μ…‹μ—… κ°€μ΄λ“œ (v40) μ†ŒμŠ€: dev-to-ai MD 파일: content/2026-05-26/dev-to-ai-llm-v40.md

핡심 λ‚΄μš©

둜컬 LLM μ…‹μ—… κ°€μ΄λ“œ v40κ°€ κ³΅κ°œλ˜λ©΄μ„œ, λ¦¬λˆ…μŠ€μ—μ„œ ν”„λΌμ΄λ²„μ‹œ 쀑심 AI ν™˜κ²½μ„ 직접 κ΅¬μΆ•ν•˜λŠ” 기쀀이 μ •λ¦¬λμ–΄μš”.

κ°€μ΄λ“œλŠ” Ubuntu 20.04+/Debian 11+, μ΅œμ†Œ 4μ½”μ–΄ CPUΒ·16GB RAMΒ·50GB μ €μž₯곡간, ꢌμž₯ 8μ½”μ–΄Β·32GB RAM을 μ œμ‹œν–ˆμ–΄μš”. GPUλŠ” GTX 10xx 이상과 CUDA 11.8+λ₯Ό ꢌμž₯ν•΄μš”.

ν”„λ ˆμž„μ›Œν¬λŠ” llama.cpp, Ollama, vLLM, LocalAIλ₯Ό λΉ„κ΅ν–ˆκ³  μ΅œμ’… μΆ”μ²œμ€ llama.cppμ˜ˆμš”. μ˜ˆμ‹œ 싀행은 Llama-2-7B GGUF에 μ΅œλŒ€ 512토큰, temp 0.7, repeat penalty 1.1, GPU μ˜€ν”„λ‘œλ”© -ngl 35 섀정을 μ‚¬μš©ν–ˆκ±°λ“ μš”.

핡심은 ν΄λΌμš°λ“œ μ˜μ‘΄μ„ μ€„μ΄λ©΄μ„œλ„ μ„±λŠ₯Β·λΉ„μš©Β·μ •μ±… ν†΅μ œλ₯Ό κ· ν˜• 있게 κ°€μ Έκ°€λŠ” μ‹€μ „ 기쀀이 μƒκ²Όλ‹€λŠ” μ μ΄μ—μš”.

작돌쌀의 ν•œλ§ˆλ””

llama.cppλ₯Ό μ€‘μ‹¬μœΌλ‘œ μ„€μΉ˜Β·CUDA λΉŒλ“œΒ·μ‹€ν–‰ νŒŒλΌλ―Έν„°(-n 512, temp 0.7)κΉŒμ§€ μ œμ‹œν•΄ μž¬ν˜„μ„±μ΄ λ†’μ•„μš”. λ³΄μ•ˆκ³Ό μ§€μ—°μ‹œκ°„μ„ 직접 ν†΅μ œν•˜κΈ° μ‰¬μ›Œμ Έμš”.


좜처: 둜컬 LLM μ…‹μ—… κ°€μ΄λ“œ (v40)

이 글이 μ–΄λ• λ‚˜μš”?

κ΄€λ ¨ κΈ€

AI μ—μ΄μ „νŠΈκ°€ μΆ”λ‘  μ‹œμ μ— μ‹€μ‹œκ°„ 데이터λ₯Ό 직접 λŒμ–΄μ˜¬ 수 있게 된 κ±°μ˜ˆμš”

AI μ—μ΄μ „νŠΈκ°€ μΆ”λ‘  μ‹œμ μ— μ‹€μ‹œκ°„ 데이터λ₯Ό 직접 λŒμ–΄μ˜¬ 수 있게 된 κ±°μ˜ˆμš”.

작돌쌀2λΆ„ μ†Œμš”

λ°”μ΄λΈŒ 코딩은 직관과 즉ν₯적 μš”κ΅¬μ‚¬ν•­μœΌλ‘œ λΉ λ₯΄κ²Œ κ΅¬ν˜„ν•˜λŠ” 방식이고, μŠ€νŽ™ 코딩은 μ½”λ“œ ν•œ 쀄 μ“°κΈ° 전에 λ¬Έμ„œν™”μ™€ 섀계λ₯Ό λ¨Όμ € λλ‚΄λŠ” λ°©μ‹μ΄μ—μš”

λ°”μ΄λΈŒ 코딩은 직관과 즉ν₯적 μš”κ΅¬μ‚¬ν•­μœΌλ‘œ λΉ λ₯΄κ²Œ κ΅¬ν˜„ν•˜λŠ” 방식이고, μŠ€νŽ™ 코딩은 μ½”λ“œ ν•œ 쀄 μ“°κΈ° 전에 λ¬Έμ„œν™”μ™€ 섀계λ₯Ό λ¨Όμ € λλ‚΄λŠ” λ°©μ‹μ΄μ—μš”.

작돌쌀2λΆ„ μ†Œμš”

루카 κ³Όλ‹€λ‹ˆλ…Έ 감독이 메가폰을 작고 μ•€λ“œλ£¨ κ°€ν•„λ“œκ°€ μƒ˜ μ•ŒνŠΈλ§Œ 역을 맑은 μž‘ν’ˆμΈλ°μš”

루카 κ³Όλ‹€λ‹ˆλ…Έ 감독이 메가폰을 작고 μ•€λ“œλ£¨ κ°€ν•„λ“œκ°€ μƒ˜ μ•ŒνŠΈλ§Œ 역을 맑은 μž‘ν’ˆμΈλ°μš”.

작돌쌀2λΆ„ μ†Œμš”