2026-03-23

논문은 두 좕을 μ œμ•ˆν–ˆμ–΄μš”

πŸ’‘ ν•œμ€„ μš”μ•½|논문은 두 좕을 μ œμ•ˆν–ˆμ–΄μš”.

μž₯κΈ° μž‘μ—…μ—μ„œ ν—€λ§€λ˜ LLM μ—μ΄μ „νŠΈ, β€˜μ„œλΈŒκ³¨+λ§ˆμΌμŠ€ν†€ 보상’ μ‘°ν•©μœΌλ‘œ μ„±λŠ₯이 크게 λ›°μ—ˆμ–΄μš”.

논문은 두 좕을 μ œμ•ˆν–ˆμ–΄μš”. μ‹€ν–‰ 쀑엔 λͺ©ν‘œλ₯Ό μ„œλΈŒκ³¨λ‘œ μͺΌκ°œ μ‹€μ‹œκ°„ κ³„νšν•˜κ³ , ν•™μŠ΅ 땐 MiRA둜 λ§ˆμΌμŠ€ν†€ 기반의 μ΄˜μ΄˜ν•œ 보상을 μ£ΌλŠ” λ°©μ‹μ΄κ±°λ“ μš”. μ›Ή νƒμƒ‰μ²˜λŸΌ 단계가 κΈ΄ κ³Όμ œμ— 맞좘 μ„€κ³„μ˜ˆμš”.

κ²°κ³Όκ°€ κ°•ν–ˆμ–΄μš”. WebArena-Liteμ—μ„œ Gemini 계열은 성곡λ₯ μ΄ μ ˆλŒ€κ°’ κΈ°μ€€ μ•½ 10%p 올랐고, μ˜€ν”ˆλͺ¨λΈ Gemma3-12BλŠ” 6.4%μ—μ„œ 43.0%둜 μƒμŠΉν–ˆμ–΄μš”. GPT-4-Turbo 17.6%, GPT-4o 13.9%, WebRL 38.4%보닀 높은 μˆ˜μΉ˜μ˜ˆμš”.

핡심은 λͺ¨λΈ 크기 κ²½μŸλ³΄λ‹€ κ³„νš ꡬ쑰와 보상 섀계가 μž₯κΈ° μ—μ΄μ „νŠΈ μ„±λŠ₯을 κ°€λ₯Έλ‹€λŠ” μ μ΄μ—μš”.

이 글이 μ–΄λ• λ‚˜μš”?

κ΄€λ ¨ κΈ€

AIκ°€ μš°μšΈμ¦Β·λΆˆμ•ˆ 심각도λ₯Ό μžλ™μœΌλ‘œ ν‰κ°€ν•˜λŠ” ν”„λ ˆμž„μ›Œν¬ ADAPTSκ°€ κ³΅κ°œλμ–΄μš”

AIκ°€ μš°μšΈμ¦Β·λΆˆμ•ˆ 심각도λ₯Ό μžλ™μœΌλ‘œ ν‰κ°€ν•˜λŠ” ν”„λ ˆμž„μ›Œν¬ ADAPTSκ°€ κ³΅κ°œλμ–΄μš”. 핡심은 κΈ΄ μž„μƒ 인터뷰λ₯Ό 증상별 μΆ”λ‘  과제둜 λΆ„ν•΄ν•˜λŠ” λ°©μ‹μ΄μ—μš”. LLM μ—¬λŸ¬ 개λ₯Ό ν˜Όν•©ν•œ μ•„ν‚€ν…μ²˜(mixture-of-agent

작돌쌀1λΆ„ μ†Œμš”

νŒ€ λŒ€ν™”μ—μ„œ "λ©˜νƒˆ λͺ¨λΈ 뢈일치"λ₯Ό μžλ™ κ°μ§€ν•˜λŠ” AI ν”„λ ˆμž„μ›Œν¬κ°€ λ‚˜μ™”μ–΄μš”

νŒ€ λŒ€ν™”μ—μ„œ "λ©˜νƒˆ λͺ¨λΈ 뢈일치"λ₯Ό μžλ™ κ°μ§€ν•˜λŠ” AI ν”„λ ˆμž„μ›Œν¬κ°€ λ‚˜μ™”μ–΄μš”. νŒ€μ›λΌλ¦¬ μΌν•˜λ‹€ 보면 μ„œλ‘œ λ‹€λ₯Έ 정보λ₯Ό κ°–κ²Œ λ˜λŠ” κ²½μš°κ°€ λ§Žμ€λ°, 이 뢈일치λ₯Ό λŒ€ν™” μ†μ—μ„œ μ‹€μ‹œκ°„μœΌλ‘œ ν¬μ°©ν•˜λŠ” λ°©λ²•λ‘ μ΄μ—μš”. μ—°κ΅¬νŒ€μ€

작돌쌀1λΆ„ μ†Œμš”

AI μ—μ΄μ „νŠΈκ°€ 창의적으둜 도ꡬλ₯Ό ν™œμš©ν•˜λŠ” λŠ₯λ ₯을 μΈ‘μ •ν•˜λŠ” μƒˆ 벀치마크 'CreativityBench'κ°€ κ³΅κ°œλμ–΄μš”

AI μ—μ΄μ „νŠΈκ°€ 창의적으둜 도ꡬλ₯Ό ν™œμš©ν•˜λŠ” λŠ₯λ ₯을 μΈ‘μ •ν•˜λŠ” μƒˆ 벀치마크 'CreativityBench'κ°€ κ³΅κ°œλμ–΄μš”. μ—°κ΅¬νŒ€μ€ 4,000개 사물과 15만 개 μ΄μƒμ˜ μ–΄ν¬λ˜μŠ€(affordance, 사물이 μ–΄λ–€ μš©λ„λ‘œ

작돌쌀1λΆ„ μ†Œμš”