2026-04-06

ARC-AGIλŠ” "AIκ°€ μ§„μ§œ 좔둠을 ν•˜λŠ”μ§€" ν…ŒμŠ€νŠΈν•˜λŠ” κ°€μž₯ κΉŒλ‹€λ‘œμš΄ 벀치마크 쀑 ν•˜λ‚˜μ˜ˆμš”

πŸ’‘ ν•œμ€„ μš”μ•½|ARC-AGIλŠ” "AIκ°€ μ§„μ§œ 좔둠을 ν•˜λŠ”μ§€" ν…ŒμŠ€νŠΈν•˜λŠ” κ°€μž₯ κΉŒλ‹€λ‘œμš΄ 벀치마크 쀑 ν•˜λ‚˜μ˜ˆμš”.

AIκ°€ ARC-AGI-2μ—μ„œ λ‰΄λ‘œ-심볼릭 ꡬ쑰둜 μ„±λŠ₯을 16%μ—μ„œ 24.4%둜 λŒμ–΄μ˜¬λ¦¬λŠ” 데 μ„±κ³΅ν–ˆμ–΄μš”.

ARC-AGIλŠ” "AIκ°€ μ§„μ§œ 좔둠을 ν•˜λŠ”μ§€" ν…ŒμŠ€νŠΈν•˜λŠ” κ°€μž₯ κΉŒλ‹€λ‘œμš΄ 벀치마크 쀑 ν•˜λ‚˜μ˜ˆμš”. 순수 신경망은 μ‘°ν•© μΌλ°˜ν™”κ°€ μ•½ν•˜κ³ , 순수 기호 μ‹œμŠ€ν…œμ€ μ‹œκ° 인식을 λͺ» ν•˜λŠ” λ¬Έμ œκ°€ μžˆκ±°λ“ μš”. 이 μ—°κ΅¬λŠ” 두 방식을 ν•©μ³μ„œ κ²©μžμ—μ„œ 객체 ꡬ쑰λ₯Ό μΆ”μΆœν•˜κ³ , μΈκ°„μ˜ μ‹œκ° 좔상화 방식을 흉내 λ‚Έ 'λ‹¨μœ„ νŒ¨ν„΄'으둜 λ³€ν™˜ 후보λ₯Ό μ œμ•ˆν•œ λ’€, μ—¬λŸ¬ μ˜ˆμ‹œμ—μ„œ 일관성을 확인해 가섀을 κ±ΈλŸ¬λ‚΄λŠ” ꡬ쑰λ₯Ό μ œμ•ˆν–ˆμ–΄μš”.

ARC Lang Solver와 메타 λΆ„λ₯˜κΈ°λ‘œ μ‘°ν•©ν•˜λ©΄ 30.8%κΉŒμ§€ μ˜¬λΌκ°€μš”. νŒŒμΈνŠœλ‹μ΄λ‚˜ κ°•ν™”ν•™μŠ΅ 없이, 브루트포슀 탐색도 μ€„μ΄λ©΄μ„œ λ‚˜μ˜¨ 결과라 μ˜λ―Έκ°€ 있고, μ½”λ“œλ„ μ˜€ν”ˆμ†ŒμŠ€λ‘œ κ³΅κ°œλμ–΄μš”.

지각, λ³€ν™˜ μ œμ•ˆ, 기호 검증을 λΆ„λ¦¬ν•˜λŠ” ꡬ쑰가 λ²”μš© μΆ”λ‘  ν–₯μƒμ˜ μ‹€λ§ˆλ¦¬κ°€ 될 수 μžˆλ‹€λŠ” κ±Έ 보여쀀 μ—°κ΅¬μ˜ˆμš”.

이 글이 μ–΄λ• λ‚˜μš”?

κ΄€λ ¨ κΈ€

arXiv에 곡개된 AIVV 논문은 인간이 직접 ν•˜λ˜ V&V(검증·확인) μž‘μ—…μ„ LLM μ—μ΄μ „νŠΈ ν˜‘μ˜μ²΄λ‘œ μžλ™ν™”ν•˜λŠ” ν”„λ ˆμž„μ›Œν¬μ˜ˆμš”

arXiv에 곡개된 AIVV 논문은 인간이 직접 ν•˜λ˜ V&V(검증·확인) μž‘μ—…μ„ LLM μ—μ΄μ „νŠΈ ν˜‘μ˜μ²΄λ‘œ μžλ™ν™”ν•˜λŠ” ν”„λ ˆμž„μ›Œν¬μ˜ˆμš”.

작돌쌀2λΆ„ μ†Œμš”

핡심은 "자기 전에 λͺ¨λΈ λ˜μ Έλ‘λ©΄ 아침에 λΉ λ₯Έ 컀널이 μ™„μ„±λœλ‹€"λŠ” κ±°μ˜ˆμš”

핡심은 "자기 전에 λͺ¨λΈ λ˜μ Έλ‘λ©΄ 아침에 λΉ λ₯Έ 컀널이 μ™„μ„±λœλ‹€"λŠ” κ±°μ˜ˆμš”.

작돌쌀2λΆ„ μ†Œμš”

λ―Έκ΅­ ꡐ싀 μˆ˜μ—… 기둝 데이터셋(NCTE)을 ν™œμš©ν•΄ 7개 μ΅œμ‹  λͺ¨λΈμ„ ν…ŒμŠ€νŠΈν–ˆλŠ”λ°, ꡐ사 κ²½λ ₯Β·ν•™λ ₯·인쒅 같은 λ¬΄κ΄€ν•œ 정보λ₯Ό λ„£μœΌλ©΄ 7점 만점 μ²™λ„μ—μ„œ μ΅œλŒ€ 1.48μ μ΄λ‚˜ μ˜ˆμΈ‘κ°’μ΄ λ°”λ€Œμ—ˆκ±°λ“ μš”

λ―Έκ΅­ ꡐ싀 μˆ˜μ—… 기둝 데이터셋(NCTE)을 ν™œμš©ν•΄ 7개 μ΅œμ‹  λͺ¨λΈμ„ ν…ŒμŠ€νŠΈν–ˆλŠ”λ°, ꡐ사 κ²½λ ₯Β·ν•™λ ₯·인쒅 같은 λ¬΄κ΄€ν•œ 정보λ₯Ό λ„£μœΌλ©΄ 7점 만점 μ²™λ„μ—μ„œ μ΅œλŒ€ 1.48μ μ΄λ‚˜ μ˜ˆμΈ‘κ°’μ΄ λ°”λ€Œμ—ˆκ±°λ“ μš”.

작돌쌀2λΆ„ μ†Œμš”