Source: How I Built a Churn Prediction System That My Colleagues Actually Used
π£ Hook: μ λΉμ μ λͺ¨λΈμ μ°λ κΈ°ν΅μΌλ‘ κ°μκΉ?
λ°μ΄ν° κ³Όνμκ° λ°€μ λ§λ '99% μ νλμ λ₯λ¬λ μ΄ν μμΈ‘ λͺ¨λΈ'. νμ§λ§ λ§μΌν νμ μ΄κ±Έ μ°μ§ μμ΅λλ€. μλκ³ μ? "μ΄ μ μ κ° μ μννκ°μ?"λΌλ μ§λ¬Έμ λͺ¨λΈμ΄ λλ΅νμ§ λͺ»νκΈ° λλ¬Έμ λλ€.
μ μλ νλ €ν κΈ°μ λμ 'μ λ’°'λ₯Ό ꡬμΆνμ¬, μ€μ λ‘ νμ΄ μ¬μ©νλ μμΈ‘ μμ€ν μ λ§λ€μμ΅λλ€.
π οΈ The Strategy: κΈ°μ μ΄ μλ 'μν΅'μ λ¬Έμ
1. λ ΈνΈλΆ μΌκΈ° μ μ 'λ°μ΄ν° κ³μ½(Data Contract)'λΆν°
λͺ¨λΈλ§λ³΄λ€ μ€μν 건 "무μμ΄ μ΄νμΈκ°?"μ λν ν©μμ λλ€.
- λ¬Έμ : Aνμ "30μΌ λ―Έμ μ", Bνμ "ꡬλ ν΄μ§"λ₯Ό μ΄νλ‘ μ μν¨.
- ν΄κ²°: 1νμ΄μ§μ§λ¦¬ 'λ°μ΄ν° κ³μ½μ'λ₯Ό μμ±. μ λ ₯ λ°μ΄ν°μ νν, μ»¬λΌ μ μ, λΌλ²¨λ§ κ·μΉμ λͺ λ¬Έννκ³ λ²μ κ΄λ¦¬ν¨.
2. PMμ΄ μ΄ν΄ λͺ»νλ νΌμ²λ λ²λ¦°λ€
"κ³ μ°¨μ μλ² λ© λ²‘ν°"κ° μ±λ₯μ λ μ’μμ§ λͺ¨λ¦ λλ€. νμ§λ§ PMμ΄ μ΄ν΄ν μ μλ€λ©΄ κ³Όκ°ν μ μΈνμ΅λλ€.
- Good Features: μΈμ λΉλ, μ΅κ·Ό κ³ κ°μΌν° λ¬Έμ μ¬λΆ, νν λ¦¬μΌ μλ£μ¨.
- Bad Features: μ€λͺ λΆκ°λ₯ν λ³΅ν© νμ λ³μ.
3. 보μμ μΈ λͺ¨λΈ μ ν (Logistic Regression)
μ΅μ Transformer λμ λ‘μ§μ€ν± νκ·(Logistic Regression)λ₯Ό λ©μΈμΌλ‘ μΌμ΅λλ€.
- μ΄μ :
Coefficient(κ³μ)λ₯Ό ν΅ν΄ "μ μ μκ° κΉμλμ§"λ₯Ό λͺ νν μ€λͺ ν μ μκΈ° λλ¬Έμ λλ€. λλ€ ν¬λ μ€νΈλ 보쑰μ©μΌλ‘λ§ μ¬μ©νμ΅λλ€.
4. μ μλ νλμΌλ‘ μ΄μ΄μ ΈμΌ νλ€ (Actionable)
μ μλ§ λμ Έμ£Όλ 건 λ¬΄μ± μν©λλ€. μ μ ꡬκ°λ³λ‘ νΈλ¦¬κ±°λ 'μ‘μ 'μ λ§€ννμ΅λλ€.
- High Risk: μΈμ± κ°μ΄λ λ ΈμΆ (Product ν)
- Medium Risk: μ΄λ©μΌ μΊ νμΈ λ°μ‘ (Marketing ν)
MAX5μ μκ° π―
π ν΅μ¬ κ΅ν
"μ νν λͺ¨λΈ"λ³΄λ€ "μ€λͺ κ°λ₯ν λͺ¨λΈ"μ΄ λΉμ¦λμ€μμ ν¨μ¬ κ°λ ₯ν΄. νμ νμ΄ μ΄ν΄νμ§ λͺ»νλ©΄, μ무리 μ±λ₯μ΄ μ’μλ κ·Έ λͺ¨λΈμ 'μ λ’° λΉμ©'μ κ°λΉνμ§ λͺ»ν΄μ νκΈ°λκ±°λ .
π λ΄ μν©μ μ μ©νλ€λ©΄
λ°μ΄ν° λΆμ κ²°κ³Όλ₯Ό λ°ννκΈ° μ μ 'ν λ¨Έλ ν μ€νΈ'λ₯Ό ν΄λ΄.
- "μ΄ μ μ κ° μ μ΄νν΄?"λΌλ μ§λ¬Έμ, "벑ν°κ°μ΄ λ³ν΄μμ" λμ "κ³ κ°μΌν° λ¬Έμκ° λμ΄μμ"λΌκ³ λλ΅ν μ μλκ°?
- 볡μ‘ν μκ³ λ¦¬μ¦μ μ°κΈ° μ μ
Group ByμΏΌλ¦¬λ‘ λ¨Όμ μΈμ¬μ΄νΈλ₯Ό λ½μλ΄€λκ°?
β οΈ μ£Όμν μ
κ·Έλ λ€κ³ μ νλλ₯Ό ν¬κΈ°νλ 건 μλ. λ€λ§ Start Simple. λ‘μ§μ€ν± νκ·λ‘ μμν΄μ μ λ’°λ₯Ό μ»μ λ€μ, λ₯λ¬λμΌλ‘ κ³ λνν΄λ λ¦μ§ μμ.
μΉ΄ν
κ³ λ¦¬: data_science, ``