2026-03-22

ν”„λ‘¬ν”„νŠΈ 캐싱은 μ‹œμŠ€ν…œ ν”„λ‘¬ν”„νŠΈμ²˜λŸΌ λ°˜λ³΅λ˜λŠ” μž…λ ₯을 μ €μž₯해두고 μž¬μ‚¬μš©ν•˜λŠ” κΈ°λŠ₯μ΄μ—μš”

πŸ’‘ ν•œμ€„ μš”μ•½|ν”„λ‘¬ν”„νŠΈ 캐싱은 μ‹œμŠ€ν…œ ν”„λ‘¬ν”„νŠΈμ²˜λŸΌ λ°˜λ³΅λ˜λŠ” μž…λ ₯을 μ €μž₯해두고 μž¬μ‚¬μš©ν•˜λŠ” κΈ°λŠ₯μ΄μ—μš”.

OpenAI API의 ν”„λ‘¬ν”„νŠΈ 캐싱이 λΉ„μš© 절감의 핡심 κΈ°λ²•μœΌλ‘œ μ£Όλͺ©λ°›κ³  μžˆμ–΄μš”.

ν”„λ‘¬ν”„νŠΈ 캐싱은 μ‹œμŠ€ν…œ ν”„λ‘¬ν”„νŠΈμ²˜λŸΌ λ°˜λ³΅λ˜λŠ” μž…λ ₯을 μ €μž₯해두고 μž¬μ‚¬μš©ν•˜λŠ” κΈ°λŠ₯μ΄μ—μš”. OpenAI κΈ°μ€€μœΌλ‘œ 1,024토큰 μ΄μƒμ˜ ν”„λ¦¬ν”½μŠ€κ°€ 반볡될 λ•Œ ν™œμ„±ν™”λ˜κ³ , μΊμ‹œ 히트 μ‹œ μ΅œλŒ€ 50% 할인이 μ μš©λΌμš”. νŠΈλž˜ν”½μ΄ λ§Žμ€ AI μ•±μΌμˆ˜λ‘ 절감 νš¨κ³Όκ°€ μ»€μ§€λŠ” κ΅¬μ‘°μ˜ˆμš”.

μž‘λ™ μ›λ¦¬λŠ” LLM μΆ”λ‘ μ˜ 첫 단계인 프리필(pre-fill)에 μžˆμ–΄μš”. λͺ¨λΈμ΄ 첫 토큰을 μƒμ„±ν•˜κΈ° μœ„ν•΄ ν”„λ‘¬ν”„νŠΈ 전체λ₯Ό μ²˜λ¦¬ν•˜λŠ” κ³„μ‚°λŸ‰μ„ μ €μž₯ν•΄λ‘λŠ” κ±°κ±°λ“ μš”. 단, 캐싱이 되렀면 λ°˜λ³΅λ˜λŠ” 뢀뢄이 ν”„λ‘¬ν”„νŠΈμ˜ μ•žλΆ€λΆ„(ν”„λ¦¬ν”½μŠ€)에 μœ„μΉ˜ν•΄μ•Ό ν•΄μš”.

ν”„λ‘¬ν”„νŠΈ 섀계 μˆœμ„œ ν•˜λ‚˜λ‘œ API λΉ„μš©μ΄ 절반으둜 쀄어듀 수 μžˆλ‹€λŠ” μ μ—μ„œ, ν”„λ‘œλ•μ…˜ AI 앱을 μš΄μ˜ν•˜λŠ” 개발자라면 λ°˜λ“œμ‹œ 챙겨야 ν•  μ΅œμ ν™” ν¬μΈνŠΈμ˜ˆμš”.

이 글이 μ–΄λ• λ‚˜μš”?

κ΄€λ ¨ κΈ€

ν˜„μž¬ Trainium 칩은 3μ„ΈλŒ€ ν•©μ‚° 140만 κ°œκ°€ 배포돼 μžˆλŠ”λ°, 그쀑 Anthropic의 Claudeκ°€ Trainium2 μΉ© 100만 개 μ΄μƒμ—μ„œ λŒμ•„κ°€κ³  μžˆκ±°λ“ μš”

ν˜„μž¬ Trainium 칩은 3μ„ΈλŒ€ ν•©μ‚° 140만 κ°œκ°€ 배포돼 μžˆλŠ”λ°, 그쀑 Anthropic의 Claudeκ°€ Trainium2 μΉ© 100만 개 μ΄μƒμ—μ„œ λŒμ•„κ°€κ³  μžˆκ±°λ“ μš”.

작돌쌀2λΆ„ μ†Œμš”

λ””μ¦ˆλ‹ˆ 'κ²¨μšΈμ™•κ΅­'의 λˆˆμ‚¬λžŒ 캐릭터λ₯Ό λ‘œλ΄‡μœΌλ‘œ κ΅¬ν˜„ν•œ κ±°μ˜ˆμš”

λ””μ¦ˆλ‹ˆ 'κ²¨μšΈμ™•κ΅­'의 λˆˆμ‚¬λžŒ 캐릭터λ₯Ό λ‘œλ΄‡μœΌλ‘œ κ΅¬ν˜„ν•œ κ±°μ˜ˆμš”.

작돌쌀2λΆ„ μ†Œμš”

κ·Έκ°€ λͺ‡ 달에 걸쳐 μ†μˆ˜ μ‘°μ •ν•œ GPT-2 ν•™μŠ΅ 섀정을 자율 μ—μ΄μ „νŠΈμ—κ²Œ ν•˜λ£»λ°€ λ§‘κ²Όλ”λ‹ˆ, 인간이 λ†“μ³€λ˜ μ„Έλ°€ν•œ 쑰정값듀을 μ°Ύμ•„λƒˆκ±°λ“ μš”

κ·Έκ°€ λͺ‡ 달에 걸쳐 μ†μˆ˜ μ‘°μ •ν•œ GPT-2 ν•™μŠ΅ 섀정을 자율 μ—μ΄μ „νŠΈμ—κ²Œ ν•˜λ£»λ°€ λ§‘κ²Όλ”λ‹ˆ, 인간이 λ†“μ³€λ˜ μ„Έλ°€ν•œ 쑰정값듀을 μ°Ύμ•„λƒˆκ±°λ“ μš”.

작돌쌀2λΆ„ μ†Œμš”