NVIDIA Transformer EngineμΌλ‘ λ₯λ¬λ νλ ¨ μλλ₯Ό λμ΄μ¬λ¦¬λ μ€μ ꡬν κ°μ΄λκ° κ³΅κ°λμ΄μ.
ν΅μ¬μ FP8 νΌν© μ λ°λ(Mixed Precision)μμ. κΈ°μ‘΄ PyTorch κ²½λ‘μ Transformer Engine κ²½λ‘λ₯Ό λλν μ€νν΄μ μλμ λ©λͺ¨λ¦¬ μ¬μ©λμ μ§μ λΉκ΅ν μ μλλ‘ κ΅¬μ±λΌ μκ±°λ μ. GPUΒ·CUDA νκ²½ 체ν¬λΆν° νΈνμ± λ¬Έμ μλ μ²λ¦¬κΉμ§ ν¬ν¨λμ΄ μμ΄μ, μ 체 μ΅μ€ν μ λΉλκ° μ λλ νκ²½μμλ λ ΈνΈλΆμ΄ κ·Έλ₯ λμκ°μ.
ꡬμ±μ ν¬κ² κ΅μ¬ λ€νΈμν¬Β·νμ λ€νΈμν¬ κ΅¬μΆ β λ κ²½λ‘ νλ ¨ β λ²€μΉλ§ν¬ β κ²°κ³Ό μκ°ν μμμμ. μ½λ ν μ€μ© λ°λΌκ°λ©΄ "μ FP8μ΄ λΉ λ₯Έκ°"λ₯Ό μ€μΈ‘ μμΉλ‘ 체κ°ν μ μλ ꡬ쑰거λ μ.
κ³ μ±λ₯ νλ ¨ μν¬νλ‘μ°κ° μ€μ λ‘ μ΄λ»κ² μ€κ³λλμ§ κ° μ‘κ³ μΆμ μ¬λμκ² λ± λ§λ μ€μ΅ μλ£μμ.