2026-04-06

λ―Έκ΅­ ꡐ싀 μˆ˜μ—… 기둝 데이터셋(NCTE)을 ν™œμš©ν•΄ 7개 μ΅œμ‹  λͺ¨λΈμ„ ν…ŒμŠ€νŠΈν–ˆλŠ”λ°, ꡐ사 κ²½λ ₯Β·ν•™λ ₯·인쒅 같은 λ¬΄κ΄€ν•œ 정보λ₯Ό λ„£μœΌλ©΄ 7점 만점 μ²™λ„μ—μ„œ μ΅œλŒ€ 1.48μ μ΄λ‚˜ μ˜ˆμΈ‘κ°’μ΄ λ°”λ€Œμ—ˆκ±°λ“ μš”

πŸ’‘ ν•œμ€„ μš”μ•½|λ―Έκ΅­ ꡐ싀 μˆ˜μ—… 기둝 데이터셋(NCTE)을 ν™œμš©ν•΄ 7개 μ΅œμ‹  λͺ¨λΈμ„ ν…ŒμŠ€νŠΈν–ˆλŠ”λ°, ꡐ사 κ²½λ ₯Β·ν•™λ ₯·인쒅 같은 λ¬΄κ΄€ν•œ 정보λ₯Ό λ„£μœΌλ©΄ 7점 만점 μ²™λ„μ—μ„œ μ΅œλŒ€ 1.48μ μ΄λ‚˜ μ˜ˆμΈ‘κ°’μ΄ λ°”λ€Œμ—ˆκ±°λ“ μš”.

LLM이 κ΄€κ³„μ—†λŠ” μ‚¬νšŒμ  λ§₯락 정보에 편ν–₯λ˜λŠ” 문제λ₯Ό 84% μ€„μ΄λŠ” 방법이 λ‚˜μ™”μ–΄μš”.

λ―Έκ΅­ ꡐ싀 μˆ˜μ—… 기둝 데이터셋(NCTE)을 ν™œμš©ν•΄ 7개 μ΅œμ‹  λͺ¨λΈμ„ ν…ŒμŠ€νŠΈν–ˆλŠ”λ°, ꡐ사 κ²½λ ₯Β·ν•™λ ₯·인쒅 같은 λ¬΄κ΄€ν•œ 정보λ₯Ό λ„£μœΌλ©΄ 7점 만점 μ²™λ„μ—μ„œ μ΅œλŒ€ 1.48μ μ΄λ‚˜ μ˜ˆμΈ‘κ°’μ΄ λ°”λ€Œμ—ˆκ±°λ“ μš”. ν₯미둜운 건 λͺ¨λΈ 크기가 클수둝 μ •ν™•λ„λŠ” 높아도 이런 편ν–₯에 더 λ―Όκ°ν•œ κ²½μš°κ°€ μžˆμ—ˆλ‹€λŠ” κ±°μ˜ˆμš”.

μ—°κ΅¬νŒ€μ΄ μ œμ•ˆν•œ Debiasing-DPOλŠ” λ§₯락 없이 μƒμ„±ν•œ 쀑립 μΆ”λ‘ κ³Ό, λΆˆν•„μš”ν•œ λ§₯락이 μ„žμΈ 편ν–₯ 좔둠을 쌍으둜 λ¬Άμ–΄ ν›ˆλ ¨μ‹œν‚€λŠ” λ°©μ‹μ΄μ—μš”. Llama와 Qwen 3BΒ·7B λͺ¨λΈμ— μ μš©ν–ˆλ”λ‹ˆ 편ν–₯은 평균 84% κ°μ†Œ, 예츑 μ •ν™•λ„λŠ” 52% ν–₯μƒλμ–΄μš”.

λͺ¨λΈμ„ 크게 λ§Œλ“ λ‹€κ³  편ν–₯이 μžμ—°μŠ€λŸ½κ²Œ ν•΄κ²°λ˜μ§€ μ•ŠλŠ”λ‹€λŠ” κ±Έ μ‹€μ¦ν–ˆλ‹€λŠ” μ μ—μ„œ, κ³ μœ„ν—˜ μ˜μ‚¬κ²°μ •μ— LLM을 μ“Έ λ•Œ λ³„λ„μ˜ 디바이어싱 ν›ˆλ ¨μ΄ ν•„μš”ν•˜λ‹€λŠ” 경고둜 μ½ν˜€μš”.

이 글이 μ–΄λ• λ‚˜μš”?