2026-04-08

κΈ°μ‘΄ LLM 기반 μ΅œμ ν™” μ—°κ΅¬λŠ” μ½”λ“œλ₯Ό ν•œ 번 μƒμ„±ν•˜λ©΄ λμ΄μ—ˆκ±°λ“ μš”

πŸ’‘ ν•œμ€„ μš”μ•½|κΈ°μ‘΄ LLM 기반 μ΅œμ ν™” μ—°κ΅¬λŠ” μ½”λ“œλ₯Ό ν•œ 번 μƒμ„±ν•˜λ©΄ λμ΄μ—ˆκ±°λ“ μš”.

LLM이 μ§„ν™” μ•Œκ³ λ¦¬μ¦˜ μ•ˆμ—μ„œ 슀슀둜 반볡 μΆ”λ‘ ν•˜λ©° νœ΄λ¦¬μŠ€ν‹±μ„ μ„€κ³„ν•˜λŠ” ReVEL ν”„λ ˆμž„μ›Œν¬κ°€ κ³΅κ°œλμ–΄μš”.

κΈ°μ‘΄ LLM 기반 μ΅œμ ν™” μ—°κ΅¬λŠ” μ½”λ“œλ₯Ό ν•œ 번 μƒμ„±ν•˜λ©΄ λμ΄μ—ˆκ±°λ“ μš”. ReVEL은 λ‹€λ₯΄κ²Œ μ ‘κ·Όν–ˆμ–΄μš”. 후보 νœ΄λ¦¬μŠ€ν‹±μ„ 행동 νŒ¨ν„΄λ³„λ‘œ κ·Έλ£Ήν™”ν•œ λ’€, LLM이 κ·Έλ£Ή μˆ˜μ€€μ˜ ν”Όλ“œλ°±μ„ λ°›μ•„ μ—¬λŸ¬ 턴에 걸쳐 κ°œμ„ μ•ˆμ„ λ„μΆœν•΄μš”. 이 κ°œμ„ μ•ˆμ€ μ§„ν™” μ•Œκ³ λ¦¬μ¦˜ 기반 메타 μ»¨νŠΈλ‘€λŸ¬κ°€ 탐색과 ν™œμš©μ˜ κ· ν˜•μ„ λ§žμΆ°κ°€λ©° 선별 μ μš©ν•΄μš”.

NP-λ‚œν•΄ μ‘°ν•© μ΅œμ ν™” 벀치마크 μ‹€ν—˜μ—μ„œ κΈ°μ‘΄ κ°•λ ₯ν•œ 베이슀라인 λŒ€λΉ„ ν†΅κ³„μ μœΌλ‘œ μœ μ˜λ―Έν•œ μ„±λŠ₯ ν–₯상을 λ‹¬μ„±ν–ˆμ–΄μš”.

"ν•œ 번 물어보고 끝"이 μ•„λ‹ˆλΌ "λŒ€ν™”ν•˜λ©° λ‹€λ“¬λŠ”" 방식이 μžλ™ μ•Œκ³ λ¦¬μ¦˜ μ„€κ³„μ—μ„œλ„ ν†΅ν•œλ‹€λŠ” κ±Έ 보여쀀 μ—°κ΅¬μ˜ˆμš”.

이 글이 μ–΄λ• λ‚˜μš”?

κ΄€λ ¨ κΈ€

'Pramana'λŠ” 인도 μ² ν•™μ˜ 냐야-냐야(Navya-Nyaya) 논리 체계λ₯Ό LLM νŒŒμΈνŠœλ‹μ— μ μš©ν•œ λ°©λ²•λ‘ μ΄μ—μš”

'Pramana'λŠ” 인도 μ² ν•™μ˜ 냐야-냐야(Navya-Nyaya) 논리 체계λ₯Ό LLM νŒŒμΈνŠœλ‹μ— μ μš©ν•œ λ°©λ²•λ‘ μ΄μ—μš”.

작돌쌀2λΆ„ μ†Œμš”

arXiv에 게재된 이 논문은 메타인지(자기 인지 λͺ¨λ‹ˆν„°λ§)κ°€ μˆœμ„œμ— 따라 λ‹¬λΌμ§€λŠ” ν˜„μƒμ„ μˆ˜ν•™μ μœΌλ‘œ λΆ„μ„ν–ˆμ–΄μš”

arXiv에 게재된 이 논문은 메타인지(자기 인지 λͺ¨λ‹ˆν„°λ§)κ°€ μˆœμ„œμ— 따라 λ‹¬λΌμ§€λŠ” ν˜„μƒμ„ μˆ˜ν•™μ μœΌλ‘œ λΆ„μ„ν–ˆμ–΄μš”.

작돌쌀2λΆ„ μ†Œμš”

MMORFλΌλŠ” ν”„λ ˆμž„μ›Œν¬κ°€ 218개 벀치마크 κ³Όμ œμ—μ„œ κΈ°μ‘΄ 졜고 μ„±λŠ₯을 λ›°μ–΄λ„˜μ—ˆκ±°λ“ μš”

MMORFλΌλŠ” ν”„λ ˆμž„μ›Œν¬κ°€ 218개 벀치마크 κ³Όμ œμ—μ„œ κΈ°μ‘΄ 졜고 μ„±λŠ₯을 λ›°μ–΄λ„˜μ—ˆκ±°λ“ μš”.

작돌쌀2λΆ„ μ†Œμš”