2026-03-17

총 νŒŒλΌλ―Έν„° 1,190μ–΅ 개의 MoE ꡬ쑰인데, μ‹€μ œλ‘œ 토큰 처리 μ‹œ ν™œμ„±ν™”λ˜λŠ” 건 60μ–΅ κ°œμ˜ˆμš”

πŸ’‘ ν•œμ€„ μš”μ•½|총 νŒŒλΌλ―Έν„° 1,190μ–΅ 개의 MoE ꡬ쑰인데, μ‹€μ œλ‘œ 토큰 처리 μ‹œ ν™œμ„±ν™”λ˜λŠ” 건 60μ–΅ κ°œμ˜ˆμš”.

Mistral AIκ°€ ν•˜λ‚˜λ‘œ λ‹€ λ˜λŠ” λͺ¨λΈ, Mistral Small 4λ₯Ό κ³΅κ°œν–ˆμ–΄μš”.

총 νŒŒλΌλ―Έν„° 1,190μ–΅ 개의 MoE ꡬ쑰인데, μ‹€μ œλ‘œ 토큰 처리 μ‹œ ν™œμ„±ν™”λ˜λŠ” 건 60μ–΅ κ°œμ˜ˆμš”. νŠΉμ΄ν•œ 건 기쑴에 λ”°λ‘œ μ‘΄μž¬ν•˜λ˜ μΆ”λ‘  λͺ¨λΈ(Magistral), λΉ„μ „ λͺ¨λΈ(Pixtral), μ½”λ”© λͺ¨λΈ(Devstral)을 λͺ¨λ‘ ν•˜λ‚˜λ‘œ ν†΅ν•©ν–ˆλ‹€λŠ” κ±°μ˜ˆμš”.

μ»¨ν…μŠ€νŠΈ 창은 256kκΉŒμ§€ μ§€μ›ν•˜κ³ , μΆ”λ‘  강도λ₯Ό μš”μ²­λ§ˆλ‹€ μ‘°μ ˆν•  수 μžˆμ–΄μš”. reasoning_effort νŒŒλΌλ―Έν„°λ‘œ λΉ λ₯Έ 닡변이 ν•„μš”ν•˜λ©΄ "none", 깊게 생각해야 ν•˜λ©΄ "high"둜 μ„€μ •ν•˜λ©΄ λ˜κ±°λ“ μš”. λͺ¨λΈμ„ μ—¬λŸ¬ 개 μš΄μ˜ν•˜λŠ” λŒ€μ‹  ν•˜λ‚˜λ‘œ μš”μ²­λ§ˆλ‹€ λ‹€λ₯΄κ²Œ μ“Έ 수 μžˆλŠ” κ΅¬μ‘°μ˜ˆμš”.

"ν•˜λ‚˜μ˜ API둜 λ‹€ ν•΄κ²°"μ΄λΌλŠ” λ°©ν–₯이 점점 업계 ν‘œμ€€μ΄ λ˜μ–΄κ°€λŠ” 것 κ°™μ•„μš”.

이 글이 μ–΄λ• λ‚˜μš”?

κ΄€λ ¨ κΈ€

ILION은 κΈ°μ‘΄ ν…μŠ€νŠΈ μ•ˆμ „ μ‹œμŠ€ν…œ(μš•μ„€, 폭λ ₯ λ“± μ½˜ν…μΈ  κ²€μ—΄)κ³Ό 달리, μ—μ΄μ „νŠΈκ°€ "이 행동을 해도 λ˜λŠ”κ°€"λ₯Ό μ‹€ν–‰ 전에 νŒλ‹¨ν•΄μš”

ILION은 κΈ°μ‘΄ ν…μŠ€νŠΈ μ•ˆμ „ μ‹œμŠ€ν…œ(μš•μ„€, 폭λ ₯ λ“± μ½˜ν…μΈ  κ²€μ—΄)κ³Ό 달리, μ—μ΄μ „νŠΈκ°€ "이 행동을 해도 λ˜λŠ”κ°€"λ₯Ό μ‹€ν–‰ 전에 νŒλ‹¨ν•΄μš”.

작돌쌀2λΆ„ μ†Œμš”

핡심은 λ³΅μž‘ν•œ 신경망 정책을 "IF μ°©λ₯™μ„ μ΄ 고도가 높은 μƒνƒœμ—μ„œ μ™Όμͺ½μœΌλ‘œ ν˜λŸ¬κ°€κ³  μžˆλ‹€λ©΄, THEN μœ„μͺ½κ³Ό 였λ₯Έμͺ½ λ°©ν–₯으둜 μΆ”λ ₯을 κ°€ν•œλ‹€" 같은 IF-THEN κ·œμΉ™μœΌλ‘œ 증λ₯˜ν•˜λŠ” κ±°μ˜ˆμš”

핡심은 λ³΅μž‘ν•œ 신경망 정책을 "IF μ°©λ₯™μ„ μ΄ 고도가 높은 μƒνƒœμ—μ„œ μ™Όμͺ½μœΌλ‘œ ν˜λŸ¬κ°€κ³  μžˆλ‹€λ©΄, THEN μœ„μͺ½κ³Ό 였λ₯Έμͺ½ λ°©ν–₯으둜 μΆ”λ ₯을 κ°€ν•œλ‹€" 같은 IF-THEN κ·œμΉ™μœΌλ‘œ 증λ₯˜ν•˜λŠ” κ±°μ˜ˆμš”.

작돌쌀2λΆ„ μ†Œμš”

μ—°κ΅¬νŒ€μ€ AI μžμœ¨μ„± μˆ˜μ€€μ„ μ„Έ λ‹¨κ³„λ‘œ λ‚˜λˆ  μ‹€ν—˜ν–ˆμ–΄μš”

μ—°κ΅¬νŒ€μ€ AI μžμœ¨μ„± μˆ˜μ€€μ„ μ„Έ λ‹¨κ³„λ‘œ λ‚˜λˆ  μ‹€ν—˜ν–ˆμ–΄μš”.

작돌쌀2λΆ„ μ†Œμš”