728x90
반응형
- Zapier의 AI 제품 개발자 Tal Peretz가 작성한 글을 허락 하에 번역하였습니다.
- 원문은 여기에서 확인하실 수 있으며, 주요 내용은 아래와 같습니다.
- 프롬프트 엔지니어링 - 시작 단계
- 평가의 역할: (항해의 기준) 북극성
- AI 평가를 체계적으로 접근하기 / Systematic Approach to AI Evaluations
- 심층 테스트를 위해 데이터셋 활용하기 / Dataset Utilization for In-depth Testing
- AI의 평가로 평가 개선하기 / Refining Evaluations with AI Assessments
- 평가를 위한 지표들 / Metrics to evaluate
- 사람의 평가를 모범 기준으로 삼기 / Human Evaluation as the Gold Standard
- RAG: 필요 시 상황에 맞는 심층 정보
- 시도해 볼 기법들 / Techniques to Experiment With
- 미세조정: 전문화의 기술
- 학습 데이터의 부족: 양과 질의 균형 문제 / Insufficient Training Data: The Quantity-Quality Equilibrium
- 불균형한 학습 데이터: 편향성 딜레마 / Unbalanced Training Sets: The Bias Dilemma
- 공개 데이터 재사용: 새로운 신호가 필수적 / Reusing Public Data: The New Signal Imperative
- 부족한 프롬프트 엔지니어링: 명확한 명령 / Poor Prompt Engineering: The Clarity Commandment
- 점진적으로 평가하지 않음: 지속적인 실수 / Not Evaluating Incrementally: The Continuous Oversight
- 모든 것이 필요할 때
- 마무리하며
728x90
'12. 메일진' 카테고리의 다른 글
ITFIND 메일진 제1144호 산업분야별 정보메일 (발행 : 2023-11-24 ) (1) | 2023.11.25 |
---|---|
양자 - 정책 - 주요국 양자정보과학기술(QIST) 인력양성정책 동향 및 시사점 (23'11.23) (0) | 2023.11.24 |
Show GN: IETF RFC문서 한글 번역 서비스 (0) | 2023.11.24 |
[2023/11/13 ~ 11/19] 이번 주의 주요 ML 논문 (Top ML Papers of the Week) (0) | 2023.11.24 |
비즈니스 - 비즈니스 모델 - 푸드테크 (1) | 2023.11.24 |