728x90
반응형

 

AI가 다음 단어를 고를 때, 사실은 모든 단어 후보를 두고 확률을 계산해요.


근데 가끔 너무 이상한 단어까지 고려하면 말이 엉망이 될 수 있죠.

 

그래서 top-ktop-p


가능한 후보를 조금 제한해서 더 자연스럽게 만들기 위한 방법이에요.

 

 

Top-k 샘플링

확률이 높은 상위 k개 단어만 남기고 그 안에서 골라!

예: 다음 단어 후보가 10,000개가 있는데
k = 5 라면 → 가장 확률 높은 5개만 놓고 랜덤 선택

비유

식당에서 메뉴 5개만 추천받고 그중 골라 먹는 느낌
🍔 🍜 🍕 🥗 🍣 중 하나만 선택

  • k가 작을수록 → 더 보수적(뻔한 단어 선택)
  • k가 클수록 → 더 창의적, 가끔 이상한 선택도

Top-p(= nucleus) 샘플링

확률을 위에서부터 더하다가 합이 p(예: 0.9)가 될 때까지 단어만 남겨!

즉, 전체 확률의 90%를 차지하는 단어 그룹을 만들고
그 안에서 랜덤 선택

비유

"인기 메뉴 중 손님들이 90% 확률로 고르는 메뉴들만 보여줄게!"
🍜🍕🥗 (이들이 전체 주문의 90%를 채운다면 나머지는 제외)

  • p가 작으면 → 확률 높은 단어만 (안전/뻔함)
  • p가 크면 → 다양한 단어 허용 (창의적/위험)

차이 한눈에 보기

방식 어떻게 고르나 특징
Top-k 개수 제한 (k개) 단순, 확률 무시하고 개수로 컷
Top-p 확률 합 제한 (p) 상황에 따라 유연, 자연스러움

 

요약

모드 의미 효과
Temperature 확률 분포 전체를 넓히거나 좁힘 톤/창의성 조절
Top-k 후보 개수 제한 단순 제어
Top-p 확률 기준으로 후보 제한 더 자연스럽고 상황에 적응

아주 쉬운 한 줄 요약

  • 온도: "창의력 수치 조절기"
  • Top-k: "메뉴 5개만 추천해줘!"
  • Top-p: "사람들이 많이 고르는 메뉴만 보여줘!"
728x90
Posted by Mr. Slumber
,