Nous Research๊ฐ CNA๋ฅผ ๊ณต๊ฐํ๊ณ , MLP ํ์ฑ์ 0.1%๋ง ๊บผ๋ ๋ชจ๋ธ ๊ฑฐ๋ถ์จ์ ๋๋ถ๋ถ 50% ์ด์ ๋ฎ์ท์ด์.
๋ฐฉ๋ฒ์ ํด๋ก์ด ํ๋กฌํํธ์ ์ผ๋ฐ ํ๋กฌํํธ๋ฅผ ๋๋ ๊ฐ MLP ๋ ์ด์ด ๋ง์ง๋ง ํ ํฐ์ down projection ํ์ฑ ์ฐจ์ด๋ฅผ ๋ด๋ฐ๋ณ๋ก ๊ณ์ฐํ ๋ค, ์ ๋๊ฐ ์์ k๋ง ๊ณ ๋ฅด๋ ๊ฑฐ์์. k๋ ์ ์ฒด MLP ํ์ฑ์ 0.1%๋ก ์ค์ ํ์ด์.
์ด ๋ฐฉ์์ gradient, ๋ณด์กฐํ์ต, ๊ฐ์ค์น ์์ ์ด ์ ํ ์๊ณ forward pass๋ง ํ์ํด์. LlamaยทQwen ๊ณ์ด 1B~72B์์ ๋์ํ๊ณ , steering ๊ฐ๋๋ฅผ ๋์ฌ๋ ์ถ๋ ฅ ํ์ง์ด 0.97 ์ด์ ์ ์ง๋์ด์.
ํต์ฌ ์์ฌ์ ์ ์ ๋ ฌ ๋ฏธ์ธ์กฐ์ ์ด ์ ์์ ๊ตฌ์กฐ๋ฅผ ๋ง๋๋ ๊ฒ ์๋๋ผ, ์๋ ์๋ ํ๊ธฐ ๋ ์ด์ด ๊ตฌ์กฐ๋ฅผ ํฌ์ํ ๊ฑฐ๋ถ ๊ฒ์ดํธ๋ก ๋ฐ๊พผ๋ค๋ ์ ์ด์์.