RTX 3090 ํ ์ฅ์ผ๋ก 700์ต ํ๋ผ๋ฏธํฐ AI๋ฅผ ๋๋ฆฐ๋ค๊ณ ์?
NTransformer๋ผ๋ ์คํ์์ค ํ๋ก์ ํธ๊ฐ Hacker News์์ ํ์ ์์. Llama 3.1 70B ๋ชจ๋ธ์ 24GB์ง๋ฆฌ GPU ํ ์ฅ์์ ์คํํ๋ ์์ง์ด๊ฑฐ๋ ์.
๋น๊ฒฐ์ 3๋จ๊ณ ์บ์ฑ์ด์์. GPU ๋ฉ๋ชจ๋ฆฌ์ ์ฌ๋ฆด ์ ์๋ ๋ ์ด์ด๋ ์ฌ๋ฆฌ๊ณ , ๋๋จธ์ง๋ RAM์, ๊ทธ๊ฒ๋ ์ ๋๋ฉด NVMe SSD์์ ์ง์ GPU๋ก ๋ณด๋ด์. CPU๋ฅผ ์์ ๊ฑฐ์น์ง ์์์.
์ฑ๋ฅ์ด ์ธ์์ ์ธ๋ฐ์. ๊ธฐ์กด ๋ฐฉ์ ๋๋น 83๋ฐฐ ๋นจ๋ผ์ก๋์. 8B ๋ชจ๋ธ์ ์ด๋น 49ํ ํฐ์ผ๋ก ๊ฑฐ์ ์ค์๊ฐ์ด์์.
70B๋ ์์ง ์ด๋น 0.5ํ ํฐ์ด๋ผ ์ค์ฉ์ ์ด์ง ์์ง๋ง, "๋น์ผ ์๋ฒ ์์ด ์ง์์ ๋ํ AI๋ฅผ ๋๋ฆด ์ ์๋ค"๋ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ค ๊ฑฐ์์.
C++/CUDA๋ก ์ง์ ๋ง๋ค์๊ณ , PyTorch ๊ฐ์ ์ธ๋ถ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ ์ ์ด๋์. ์ง์ง ํ๋์ฝ์ด ํ๋ก์ ํธ์์.