μ μ°κ΅¬μμ λΉμ -μΈμ΄λͺ¨λΈμ μ λ΅ μ λ’°μ±μ μ΄ν μ λ§΅ μ λͺ λμ κ±°μ 무κ΄νλ€κ³ λμμ΄μ.
LLaVA-1.5, PaliGemma, Qwen2-VL(37B)μ 3,090κ° λΆν λ‘ λΆμνλλ μ΄ν
μ
-μ λ΅ μκ΄μ R_pb=0.001 μμ€μ΄μμ΄μ. λ°λ©΄ μλμν κΈ°λ° probeλ AUROC 0.740.80, ECE 0.05~0.09λ‘ λ μμ μ μΌλ‘ λ§κ³ νλ¦Όμ κ°λ €λκ±°λ μ.
λ self-consistency K=10μ R_pb=0.43μΌλ‘ κ°μ₯ κ°ν νλ μ§νμμ§λ§ μΆλ‘ λΉμ©μ΄ 10λ°° λ€μμ΄μ. LLaVAλ μμ 5κ° λ΄λ° μ κ±°λ§μΌλ‘ κ°μ²΄ μΈμ μ νλ -8.3%pκ° λ¬κ³ , PaliGemmaΒ·Qwen2-VLμ ν΅μ¬μΈ΅ μ°¨μμ μ½ 50%λ₯Ό μμ λ μ±λ₯ μ νκ° 1%p μ΄λ΄μμ΄μ.
κ²°κ΅ VLM λͺ¨λν°λ§μ μ΄ν μ ννΈλ§΅λ³΄λ€ μλμν κΈ°ν, λ μ΄μ΄λ³ λ§μ§, νκΈ° ν¬μ νλ‘λ₯Ό λ΄μΌ μ€μ μ λ’°λλ₯Ό λ μ μ‘μ μ μλ€λ λ©μμ§μμ.