2026-03-13

PACED: Distillation at the Frontier of Student Competence

PACED ๋…ผ๋ฌธ์ด โ€œํ•™์ƒ ๋ชจ๋ธ์ด ๋ง‰ ๋ฐฐ์šธ ์ˆ˜ ์žˆ๋Š” ๋‚œ์ด๋„โ€์—๋งŒ ์ฆ๋ฅ˜๋ฅผ ์ง‘์ค‘ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ œ์‹œํ–ˆ์–ด์š”.

ํ•ต์‹ฌ์€ ํ†ต๊ณผ์œจ p ๊ธฐ๋ฐ˜ ๊ฐ€์ค‘์น˜ w(p)=p^ฮฑ(1-p)^ฮฒ์˜ˆ์š”. ํ•™์ƒ์ด ์ด๋ฏธ ํ‘ธ๋Š” ๋ฌธ์ œ(ํ†ต๊ณผ์œจ ๋†’์Œ)์™€ ๋„ˆ๋ฌด ์–ด๋ ค์šด ๋ฌธ์ œ(ํ†ต๊ณผ์œจ ๋‚ฎ์Œ) ๋ชจ๋‘์—์„œ ์ฆ๋ฅ˜ ์‹ ํ˜ธ๋Œ€์žก์Œ๋น„(SNR)๊ฐ€ 0์— ๊ฐ€๊นŒ์›Œ์ง„๋‹ค๋Š” ๊ฑธ ์ด๋ก ์œผ๋กœ ๋ณด์˜€๊ฑฐ๋“ ์š”.

๋˜ ์ด Beta ์ปค๋„ ๊ณ„์—ด์ด ๊ตฌ์กฐ์ ์œผ๋กœ ํƒ€๋‹นํ•˜๊ณ , ๊ฐ€์ค‘์น˜ ์˜ค์ฐจ๊ฐ€ ์žˆ์–ด๋„ ์ตœ์•… ํšจ์œจ ์†์‹ค์ด O(ฮด^2)๋กœ ์ž‘๋‹ค๊ณ  ๋ฐํ˜”์–ด์š”. Forward KL ์ฆ๋ฅ˜, Reverse KL ์ž๊ธฐ์ฆ๋ฅ˜ ๋ชจ๋‘ ๋ฒ ์ด์Šค๋ผ์ธ ๋Œ€๋น„ ํ–ฅ์ƒ์„ ๋ณด์˜€๊ณ , ๋ง๊ฐ์€ ๋‚ฎ๊ฒŒ ์œ ์ง€ํ–ˆ๋‹ค๊ณ  ํ•ด์š”.

ํŠนํžˆ Forward KL ๋‹ค์Œ Reverse KL 2๋‹จ๊ณ„๊ฐ€ ์ถ”๋ก  ๋ฒค์น˜๋งˆํฌ์—์„œ ๊ฐ€์žฅ ๊ฐ•ํ–ˆ๋Š”๋ฐ, โ€œ๋ชจ๋“œ ์ปค๋ฒ„๋ฆฌ์ง€ ํ›„ ์„ฑ๋Šฅ ๊ณ ์ •โ€ ์ „๋žต์ด ์‹ค์ „ ์ฆ๋ฅ˜์˜ ํ‘œ์ค€์ด ๋  ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ค˜์š”.

์ด ๊ธ€์ด ์–ด๋• ๋‚˜์š”?

๊ด€๋ จ ๊ธ€

arXiv 2603.12813์—์„œ LLM ๊ธฐ๋ฐ˜ ๋ฉ€ํ‹ฐ์—์ด์ „ํŠธ๋กœ ํ”Œ๋กœ์šฐ์‹œํŠธ ์„ค๊ณ„๋ฅผ ์ž๋™ํ™”ํ•˜๋Š” ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๊ณต๊ฐœํ–ˆ๊ฑฐ๋“ ์š”

arXiv 2603.12813์—์„œ LLM ๊ธฐ๋ฐ˜ ๋ฉ€ํ‹ฐ์—์ด์ „ํŠธ๋กœ ํ”Œ๋กœ์šฐ์‹œํŠธ ์„ค๊ณ„๋ฅผ ์ž๋™ํ™”ํ•˜๋Š” ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๊ณต๊ฐœํ–ˆ๊ฑฐ๋“ ์š”.

์žก๋Œ์Œค2๋ถ„ ์†Œ์š”

์งง์€ ํˆด ํ˜ธ์ถœ์€ ์ž˜ํ•˜์ง€๋งŒ ์ƒํƒœยท์‚ฐ์ถœ๋ฌผ์ด ์Œ“์ด๋Š” ์ž‘์—…์—์„œ ๋ฌด๋„ˆ์ง€๋Š” ํ•œ๊ณ„๋ฅผ ๊ฒจ๋ƒฅํ•œ ๊ตฌ์กฐ์˜ˆ์š”

์งง์€ ํˆด ํ˜ธ์ถœ์€ ์ž˜ํ•˜์ง€๋งŒ ์ƒํƒœยท์‚ฐ์ถœ๋ฌผ์ด ์Œ“์ด๋Š” ์ž‘์—…์—์„œ ๋ฌด๋„ˆ์ง€๋Š” ํ•œ๊ณ„๋ฅผ ๊ฒจ๋ƒฅํ•œ ๊ตฌ์กฐ์˜ˆ์š”.

์žก๋Œ์Œค2๋ถ„ ์†Œ์š”

๊ธฐํšยท๋ฆฌ๋ทฐยท๋ฐฐํฌยทQA๋ฅผ 8๊ฐœ ๋ชจ๋“œ๋กœ ๋ถ„๋ฆฌํ•ด ๊ฐœ๋ฐœ ์‹ ๋ขฐ๋„๋ฅผ ๋†’์ด๋ ค๋Š” ์ ‘๊ทผ์ด๊ฑฐ๋“ ์š”

๊ธฐํšยท๋ฆฌ๋ทฐยท๋ฐฐํฌยทQA๋ฅผ 8๊ฐœ ๋ชจ๋“œ๋กœ ๋ถ„๋ฆฌํ•ด ๊ฐœ๋ฐœ ์‹ ๋ขฐ๋„๋ฅผ ๋†’์ด๋ ค๋Š” ์ ‘๊ทผ์ด๊ฑฐ๋“ ์š”.

์žก๋Œ์Œค2๋ถ„ ์†Œ์š”