πŸ“ˆμ„±κ³΅μ‚¬λ‘€2026-01-28

μ•€μŠ€λ‘œν”½, ν΄λ‘œλ“œ(Claude)의 μƒˆλ‘œμš΄ ν—Œλ²• 곡개

πŸ’‘ ν•œμ€„ μš”μ•½: μ•€μŠ€λ‘œν”½μ΄ ν΄λ‘œλ“œμ˜ 행동 지침이 λ˜λŠ” μƒˆλ‘œμš΄ 'ν—Œλ²•(Constitution)'을 κ³΅κ°œν–ˆλ‹€. '포괄적인 μ•ˆμ „', '윀리', 'μœ μ΅ν•¨'을 μ΅œμš°μ„ μœΌλ‘œ ν•˜λ©°, AIκ°€ 슀슀둜λ₯Ό ν›ˆλ ¨ν•  λ•Œ 이 λ¬Έμ„œλ₯Ό μ°Έμ‘°ν•œλ‹€.

πŸ€” 이게 뭔데?

μ•€μŠ€λ‘œν”½(Anthropic)이 μžμ‚¬μ˜ AI λͺ¨λΈμΈ ν΄λ‘œλ“œ(Claude)κ°€ λ”°λ₯΄λŠ” μƒˆλ‘œμš΄ 'ν—Œλ²•'을 λ°œν‘œν–ˆμ–΄. 이게 λ‹¨μˆœν•œ 법적 λ¬Έμ„œκ°€ μ•„λ‹ˆλΌ, ν΄λ‘œλ“œκ°€ μ–΄λ–€ κ°€μΉ˜κ΄€μ„ κ°€μ§€κ³  행동해야 ν•˜λŠ”μ§€λ₯Ό μ •μ˜ν•œ AI의 λ‚΄λ©΄ 섀계도 같은 κ±°μ•Ό.

μ˜ˆμ „μ—λŠ” "λ¬΄ν•΄ν•˜κ²Œ 행동해라" 같은 λ‹¨μˆœν•œ μ›μΉ™μ˜ λ‚˜μ—΄μ΄μ—ˆλ‹€λ©΄, μ΄λ²ˆμ—λŠ” "μ™œ" κ·Έλ ‡κ²Œ 행동해야 ν•˜λŠ”μ§€ ꡬ체적인 λ°°κ²½κ³Ό λ§₯λ½κΉŒμ§€ μ„€λͺ…ν•˜κ³  μžˆμ–΄. 마치 μ§μ›μ—κ²Œ λ§€λ‰΄μ–Όλ§Œ λ˜μ Έμ£ΌλŠ” 게 μ•„λ‹ˆλΌ, "우리 νšŒμ‚¬μ˜ 철학은 μ΄λ ‡μŠ΅λ‹ˆλ‹€"라고 κ΅μœ‘ν•˜λŠ” 것과 λΉ„μŠ·ν•΄.

이 ν—Œλ²•μ€ μ‹€μ œλ‘œ ν΄λ‘œλ“œμ˜ ν›ˆλ ¨ κ³Όμ •(Constitutional AI)에 직접 μ‚¬μš©λΌ. ν΄λ‘œλ“œλŠ” 이 λ¬Έμ„œλ₯Ό 읽고 슀슀둜 ν•©μ„± 데이터λ₯Ό μƒμ„±ν•˜κ±°λ‚˜, μžμ‹ μ˜ 닡변이 ν—Œλ²•μ— λ§žλŠ”μ§€ ν‰κ°€ν•˜λ©΄μ„œ ν•™μŠ΅ν•œλ‹€κ³  ν•΄.

πŸ“Œ 핡심 λ‚΄μš©

  • κ΄‘λ²”μœ„ν•œ μ•ˆμ „(Broadly Safe): μΈκ°„μ˜ AI 감독 λŠ₯λ ₯을 μ €ν•΄ν•˜μ§€ μ•Šμ•„μ•Ό 함. 이게 1μˆœμœ„!
  • 윀리적 행동(Broadly Ethical): μ •μ§ν•˜κ³ , μœ„ν—˜ν•˜κ±°λ‚˜ ν•΄λ‘œμš΄ 행동을 ν”Όν•  것.
  • μœ μ΅ν•¨(Genuinely Helpful): μ‚¬μš©μžλ₯Ό λ˜‘λ˜‘ν•œ μ„±μΈμœΌλ‘œ λŒ€μš°ν•˜λ©° μ‹€μ§ˆμ μΈ 도움을 쀄 것.
  • 투λͺ…μ„±: 이 ν—Œλ²•μ„ CC0 λΌμ΄μ„ μŠ€λ‘œ κ³΅κ°œν•΄μ„œ λˆ„κ΅¬λ‚˜ λ³Ό 수 있게 함.
  • μœ μ—°μ„±: λ‹¨μˆœν•œ κ·œμΉ™ μ€€μˆ˜κ°€ μ•„λ‹ˆλΌ, 상황에 맞게 원칙을 μ μš©ν•˜λŠ” νŒλ‹¨λ ₯을 κΈ°λ₯΄λŠ” 게 λͺ©ν‘œ.

MAX5의 생각 🎯

πŸ“š 핡심 κ΅ν›ˆ

AIμ—κ²Œ "λ‚˜μœ 말 ν•˜μ§€ 마"라고 ν•„ν„°λ§λ§Œ κ±°λŠ” μ‹œλŒ€λŠ” 지났어. μ΄μ œλŠ” AIμ—κ²Œ κ°€μΉ˜κ΄€κ³Ό 철학을 κ°€λ₯΄μ³μ„œ 슀슀둜 νŒλ‹¨ν•˜κ²Œ λ§Œλ“œλŠ” λ‹¨κ³„λ‘œ λ„˜μ–΄κ°”λ‹€λŠ” 증거야. 특히 "μ‚¬μš©μžλ₯Ό λ˜‘λ˜‘ν•œ 성인 λŒ€μš°ν•΄λΌ(treat users like intelligent adults)"λΌλŠ” 문ꡬ가 인상적이야. ν΄λ‘œλ“œκ°€ μ™œ GPT보닀 μ’€ 더 μ‚¬λžŒμ²˜λŸΌ λ”°λœ»ν•˜κ²Œ λ§ν•˜λŠ”μ§€ μ•Œ 것 κ°™μ§€?

πŸ”„ λ‚΄ 상황에 μ μš©ν•œλ‹€λ©΄

LLM을 ν™œμš©ν•œ μ„œλΉ„μŠ€λ₯Ό λ§Œλ“€ λ•Œ μ‹œμŠ€ν…œ ν”„λ‘¬ν”„νŠΈ(System Prompt)λ₯Ό μ§€ λ•Œ μ°Έκ³ ν•˜λ©΄ μ’‹μ•„. λ‹¨μˆœνžˆ "λ„ˆλŠ” 챗봇이야"라고 ν•˜μ§€ 말고, "λ„ˆλŠ” μ–΄λ–€ κ°€μΉ˜λ₯Ό μΆ”κ΅¬ν•˜κ³ , μ™œ κ·Έλ ‡κ²Œ ν•΄μ•Ό ν•˜λŠ”μ§€"λ₯Ό ꡬ체적인 ν—Œλ²•μ²˜λŸΌ 적어주면 훨씬 더 퀄리티 높은 닡변을 얻을 수 μžˆμ„ κ±°μ•Ό.

⚠️ μ£Όμ˜ν•  점

이 ν—Œλ²•μ€ μ™„λ²½ν•˜μ§€ μ•Šκ³  계속 μ—…λ°μ΄νŠΈλ˜λŠ” 'μ‚΄μ•„μžˆλŠ” λ¬Έμ„œ'μ•Ό. 그리고 ν—Œλ²•μ΄ μžˆλ‹€κ³  ν•΄μ„œ AIκ°€ 100% μ™„λ²½ν•˜κ²Œ λ”°λ₯΄λŠ” 건 μ•„λ‹ˆλΌλŠ” 점(λͺ¨λΈμ˜ λ³ΈλŠ₯κ³Ό ν›ˆλ ¨ κ°„μ˜ 괴리)은 항상 염두에 둬야 ν•΄.

이 글이 μ–΄λ• λ‚˜μš”?