๊ณ ์ ๋ ์ํฌํ๋ก์ฐ ํ๊ณ๋ฅผ ๋๋ ์งํํ ๊ณผํ ๋ฉํฐ์์ด์ ํธ ํ๋ ์์ํฌ โMimosaโ๊ฐ ๊ณต๊ฐ๋์ด์.
์ด ์์คํ ์ MCP๋ก ๋๊ตฌ๋ฅผ ๋์ ์ผ๋ก ์ฐพ๊ณ , ๋ฉํ ์ค์ผ์คํธ๋ ์ดํฐ๊ฐ ๊ณผ์ ๋ณ ์์ด์ ํธ ๊ตฌ์กฐ๋ฅผ ์๋ ์์ฑํด์. ์คํ ๊ฒฐ๊ณผ๋ LLM ์ฌํ์ด ํ๊ฐํ๊ณ , ํผ๋๋ฐฑ์ผ๋ก ๋ค์ ์ํฌํ๋ก์ฐ๋ฅผ ๊ณ์ ๊ฐ์ ํ๊ฑฐ๋ ์.
ScienceAgentBench์์ DeepSeek-V3.2 ๊ธฐ์ค ์ฑ๊ณต๋ฅ 43.1%๋ฅผ ๊ธฐ๋กํด ๋จ์ผ ์์ด์ ํธ์ ์ ์ ๋ฉํฐ์์ด์ ํธ ๋ฒ ์ด์ค๋ผ์ธ์ ๋ชจ๋ ์์ฐ์ด์. ๋ ผ๋ฌธ์ 48ํ์ด์ง, ๊ทธ๋ฆผ 4๊ฐ, ํ 1๊ฐ๋ก ๊ตฌํยทํ๋กฌํํธ ์ธ๋ถ๊น์ง ๊ณต๊ฐ๋๊ณ ์คํ์์ค๋ก ๋ฐฐํฌ๋์ด์.
ํต์ฌ์ ์์ด์ ํธ๋ฅผ โํ ๋ฒ ์ค๊ณํ๊ณ ๋โ์ด ์๋๋ผ ์คํ์ผ๋ก ์งํ์ํค๋ ํ๋ฆ์ผ๋ก ๋ฐ๊ฟจ๋ค๋ ์ ์ด์์.