๊ธฐ์ AI๊ฐ "๊ทธ๋ด๋ฏํ ๋ต๋ณ" ๋์ "๊ทผ๊ฑฐ ์๋ ๊ฒฐ์ "์ ๋ด๋ฆฌ๋ ๋ฐฉ๋ฒ์ ๋ด์ ๋ ผ๋ฌธ์ด arXiv์ ์ฌ๋ผ์์ด์.
LOM-action์ ๋น์ฆ๋์ค ์ด๋ฒคํธ๊ฐ ๋ฐ์ํ๋ฉด, ๊ธฐ์ ์จํจ๋ก์ง(EO)์ ์ ์๋ ์๋๋ฆฌ์ค ์กฐ๊ฑด์ ๋ฐํ์ผ๋ก ๊ฒฉ๋ฆฌ๋ ์๋๋ฐ์ค์์ ๊ทธ๋ํ๋ฅผ ์๋ฎฌ๋ ์ด์ ํด์. AI๋ ์ด ์๋ฎฌ๋ ์ด์ ๊ทธ๋ํ์์๋ง ๋ต์ ๋์ถํ๊ณ , ๋ชจ๋ ๊ฒฐ์ ์ ์์ ํ ๊ฐ์ฌ ๋ก๊ทธ๊ฐ ๋จ๊ฑฐ๋ ์.
์ฑ๋ฅ ์ฐจ์ด๊ฐ ๋์ ๋์ด์. LOM-action์ ๋๊ตฌ ์ฒด์ธ F1 ์ ์ 98.74%๋ฅผ ๋ฌ์ฑํ๋๋ฐ, ์ต์ ํ๋ก ํฐ์ด ๋ชจ๋ธ์ธ Doubao-1.8๊ณผ DeepSeek-V3.2๋ ์ ํ๋ 80%์๋ ๋ถ๊ตฌํ๊ณ F1์ 24~36%์ ๊ทธ์ณค์ด์. ๋ ผ๋ฌธ์ ์ด๊ฑธ "ํ์์ ์ ํ๋(illusive accuracy)" ํ์์ด๋ผ๊ณ ๋ถ๋ฌ์. ๋ง๋ ๊ฒ ๊ฐ์ ๋ณด์ด์ง๋ง ์ค์ ์ ๋ฌด ํ๋ฆ๊ณผ๋ ๋๋จ์ด์ง ๋ต์ ๋ธ๋ค๋ ๊ฑฐ์์.
๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ ํค์ฐ๋ ๊ฒ ์๋๋ผ, ์จํจ๋ก์ง ๊ธฐ๋ฐ ์๋ฎฌ๋ ์ด์ ๊ตฌ์กฐ๊ฐ ๊ธฐ์ AI ์ ๋ขฐ์ฑ์ ํต์ฌ์ด๋ผ๋ ์ฃผ์ฅ์ด์์.