728x90
반응형
AI가 다음 단어를 고를 때, 사실은 모든 단어 후보를 두고 확률을 계산해요.
근데 가끔 너무 이상한 단어까지 고려하면 말이 엉망이 될 수 있죠.
그래서 top-k와 top-p는
가능한 후보를 조금 제한해서 더 자연스럽게 만들기 위한 방법이에요.
Top-k 샘플링
확률이 높은 상위 k개 단어만 남기고 그 안에서 골라!
예: 다음 단어 후보가 10,000개가 있는데
k = 5 라면 → 가장 확률 높은 5개만 놓고 랜덤 선택
비유
식당에서 메뉴 5개만 추천받고 그중 골라 먹는 느낌
🍔 🍜 🍕 🥗 🍣 중 하나만 선택
- k가 작을수록 → 더 보수적(뻔한 단어 선택)
- k가 클수록 → 더 창의적, 가끔 이상한 선택도
Top-p(= nucleus) 샘플링
확률을 위에서부터 더하다가 합이 p(예: 0.9)가 될 때까지 단어만 남겨!
즉, 전체 확률의 90%를 차지하는 단어 그룹을 만들고
그 안에서 랜덤 선택
비유
"인기 메뉴 중 손님들이 90% 확률로 고르는 메뉴들만 보여줄게!"
🍜🍕🥗 (이들이 전체 주문의 90%를 채운다면 나머지는 제외)
- p가 작으면 → 확률 높은 단어만 (안전/뻔함)
- p가 크면 → 다양한 단어 허용 (창의적/위험)
차이 한눈에 보기
| 방식 | 어떻게 고르나 | 특징 |
| Top-k | 개수 제한 (k개) | 단순, 확률 무시하고 개수로 컷 |
| Top-p | 확률 합 제한 (p) | 상황에 따라 유연, 자연스러움 |
요약
| 모드 | 의미 | 효과 |
| Temperature | 확률 분포 전체를 넓히거나 좁힘 | 톤/창의성 조절 |
| Top-k | 후보 개수 제한 | 단순 제어 |
| Top-p | 확률 기준으로 후보 제한 | 더 자연스럽고 상황에 적응 |
아주 쉬운 한 줄 요약
- 온도: "창의력 수치 조절기"
- Top-k: "메뉴 5개만 추천해줘!"
- Top-p: "사람들이 많이 고르는 메뉴만 보여줘!"
728x90
'13.일상다반사' 카테고리의 다른 글
| [궁금] 온도를 사용해 샘플링할 수 있다. (0) | 2025.11.05 |
|---|---|
| [궁금] 신경망의 확률을 다룰 때는 언더플로 문제를 줄이는 데 도움이 되기 때문에 로그 스케일이 선호된다. (0) | 2025.11.05 |
| 5 Questions for Mar Hicks (Mar Hicks에게 묻는 5가지 질문) (0) | 2025.10.25 |
| [HowToDo] Explainpaper (0) | 2025.09.24 |
| [HowToDo] 국정감사 질의서, AI로 준비하기 (1) | 2025.09.24 |


