🧠 1GB 미만으로 폰에서 돌아가는 '생각하는' AI, LFM 2.5

💡 한줄 요약: Liquid AI가 1.2B 파라미터 크기의 초경량 'Thinking' 모델을 공개했다. 폰에서도 돌아가는데, OpenAI o1처럼 '생각하는 과정'을 거쳐서 추론 능력이 짱짱하다. 에이전트용 두뇌로 딱임!

🤔 이게 뭔데?

Liquid AI에서 LFM 2.5 1.2B Thinking 모델을 내놨어. 이게 왜 대박이냐면:

초경량: 파라미터가 1.2B(12억 개)밖에 안 돼.
온디바이스: 메모리를 1GB도 안 써서 스마트폰이나 라즈베리 파이에서도 쌩쌩 돌아가.
Thinking 모델: 그냥 답변을 뱉는 게 아니라, "생각하는 과정(Chain of Thought)"을 먼저 출력하고 답을 줘. (OpenAI o1 스타일)

예전에는 이런 추론 능력 가지려면 거대한 데이터센터 GPU가 필요했잖아? 이제는 내 맥북이나 폰에서도 고지능 에이전트를 돌릴 수 있다는 거야.

📌 핵심 기능

크기 대비 미친 성능: 수학(MATH 500) 점수가 88점 가까이 나옴. (비슷한 크기 모델들은 60점대)
둠 루프(Doom Loop) 방지: 생각만 하다가 뱅뱅 도는 문제를 해결하기 위해 특별한 훈련(RLVR)을 시켰대.
오프라인 사용 가능: 인터넷 끊겨도 로컬에서 내 개인정보 안전하게 지키면서 복잡한 작업을 시킬 수 있어.

MAX5의 생각 🎯

👨💻 바이브 코딩 레시피

이 모델, llama.cpp로 바로 돌릴 수 있어! 로컬에서 나만의 'Thinking 에이전트'를 띄워보자.

설치 및 실행 (터미널)

# 1. llama.cpp 다운로드 (Homebrew)
brew install llama.cpp

# 2. 모델 다운로드 (HuggingFace에서 GGUF 파일 받기)
# (이미지 링크 참고해서 GGUF 받은 후)

# 3. 서버 실행
llama-server -m lfm-2.5-1.2b-thinking.Q4_K_M.gguf --ctx-size 8192

이렇게 띄워두고 Cursor나 VS Code에서 로컬 API(http://localhost:8080) 연결하면, 공짜로, 무제한으로, 인터넷 없이 코딩 도와주는 똑똑한 비서를 얻는 거야. 특히 간단한 로직 검증이나 데이터 추출할 때 최고야.

💸 사이드 프로젝트 아이디어

"프라이버시 절대 보장 일기 분석 앱" 어때? 사용자의 일기 내용을 서버로 절대 보내지 않고, 사용자 폰(On-device)에서 바로 이 모델로 분석해서 "오늘의 기분", "숨겨진 감정"을 리포트로 써주는 앱. 서버 비용 0원, 보안 걱정 0원!

1GB 미만으로 폰에서 돌아가는 '생각하는' AI, LFM 2.5

🤔 이게 뭔데?

📌 핵심 기능

MAX5의 생각 🎯

👨💻 바이브 코딩 레시피

💸 사이드 프로젝트 아이디어

관련 글

제품 출시 - 원문 기반 요약 필요

금융권 전용 Claude 에이전트 템플릿 10종이 한꺼번에 공개됐어요

제품 출시 - 원문 기반 요약 필요