728x90
반응형
(개념) 정밀도와 재현율에 대한 종합 점수
LLM이 분류 또는 예측에 사용될 때 적용된다.
예를 들어 고객 지원 LLM이 고객에게 일련의 조치를 얼마나 잘 권장하는지를 평가할 수 있다.
https://www.v7labs.com/blog/f1-score-guide
F1 Score in Machine Learning: Intro & Calculation
F1 score is a machine learning evaluation metric that combines precision and recall scores. Learn how and when to use it to measure model accuracy effectively.
www.v7labs.com
728x90
'07.AI' 카테고리의 다른 글
모델 성능 평가 - 데이터 분류 - 세이커 블루(sacreBLEU) (0) | 2024.05.14 |
---|---|
모델 성능 평가 - 데이터 분류 - 루즈 L(Rouge L) (0) | 2024.05.14 |
모델 성능 평가 - 데이터 분류 - ROC 커브 (0) | 2024.05.14 |
데이터 분류 모델 - 혼동행렬 (0) | 2024.05.14 |
통계 - t-분포와 Normal 분포 (0) | 2024.05.14 |