[궁금] top-k, top-p

13.일상다반사 2025. 11. 5. 23:27

728x90

AI가 다음 단어를 고를 때, 사실은 모든 단어 후보를 두고 확률을 계산해요.

근데 가끔 너무 이상한 단어까지 고려하면 말이 엉망이 될 수 있죠.

그래서 top-k와 top-p는

가능한 후보를 조금 제한해서 더 자연스럽게 만들기 위한 방법이에요.

Top-k 샘플링

확률이 높은 상위 k개 단어만 남기고 그 안에서 골라!

예: 다음 단어 후보가 10,000개가 있는데
k = 5 라면 → 가장 확률 높은 5개만 놓고 랜덤 선택

식당에서 메뉴 5개만 추천받고 그중 골라 먹는 느낌
🍔 🍜 🍕 🥗 🍣 중 하나만 선택

확률을 위에서부터 더하다가 합이 p(예: 0.9)가 될 때까지 단어만 남겨!

즉, 전체 확률의 90%를 차지하는 단어 그룹을 만들고
그 안에서 랜덤 선택

"인기 메뉴 중 손님들이 90% 확률로 고르는 메뉴들만 보여줄게!"
🍜🍕🥗 (이들이 전체 주문의 90%를 채운다면 나머지는 제외)

차이 한눈에 보기

요약

아주 쉬운 한 줄 요약

728x90

[용어] 인공지능 - Slop (슬롭) (2)	2025.11.15
[용어] AI의 더닝–크루거 효과(Dunning–Kruger Effect in AI) (0)	2025.11.12
[궁금] 온도를 사용해 샘플링할 수 있다. (0)	2025.11.05
[궁금] 신경망의 확률을 다룰 때는 언더플로 문제를 줄이는 데 도움이 되기 때문에 로그 스케일이 선호된다. (0)	2025.11.05
5 Questions for Mar Hicks (Mar Hicks에게 묻는 5가지 질문) (0)	2025.10.25

Posted by Mr. Slumber