Stepwise๊ฐ ์์คํ ๊ฒ์ฆ ์๋ํ์์ seL4 ์ ๋ฆฌ์ ์ต๋ 77.6%๋ฅผ ์ฆ๋ช ํ์ด์. ๊ธฐ์กด LLM ๊ธฐ๋ฐ ์ ๊ทผ๊ณผ ๋จ๋ Sledgehammer๋ฅผ ํฌ๊ฒ ๋์ ๊ฒฐ๊ณผ๊ฑฐ๋ ์.
์ด ํ๋ ์์ํฌ๋ ์ ๊ฒฝ๋ง+๊ธฐํธ ์ถ๋ก ์ ๊ฒฐํฉํ ๋ฐฉ์์ด์์. ์ฆ๋ช ์ํ ํธ๋ฆฌ๋ฅผ best-first๋ก ํ์ํ๋ฉด์ LLM์ด ๋ค์ ์ฆ๋ช ์คํ ํ๋ณด๋ฅผ ๋ด๊ณ , ๊ฑฐ์ ๋ ์คํ ์ ITP ๋๊ตฌ๋ก ๋ณต๊ตฌํด์.
๋ proof state-step ๋ฐ์ดํฐ๋ก LLM์ ํ์ธํ๋ํ๊ณ , Isabelle REPL์์ ์ธ๋ฐํ ์ฆ๋ช ์ํ๋ฅผ ๋ ธ์ถํด ํํฐ๋งยท๋ญํนยท์๋ธ๊ณจ ์๋ ํด๊ฒฐ๊น์ง ๋ถ์์ด์. seL4๋ฟ ์๋๋ผ ์ถ๊ฐ Isabelle ๋ฒค์น๋งํฌ์์๋ ์ผ๋ฐํ ์ฑ๋ฅ์ ๋ณด์์ด์.
์๋ฏธ๋ ๋ถ๋ช ํด์. ๋๊ท๋ชจ ์ํํธ์จ์ด ๊ฒ์ฆ์ด ์์์ ์ค์ฌ์์ ์๋ ํ์ ์ค์ฌ์ผ๋ก ๋์ด๊ฐ ํ์ค์ ์ธ ๊ฒฝ๋ก๊ฐ ์ด๋ฆฌ๊ณ ์๋ค๋ ์ ์ด์์.