728x90
반응형

머신러닝 파이프라인 단계

머신러닝 파이프라인은 새로운 학습 데이터 수집으로 시작하여 새로 학습된 모델이 어떻게 작동하는지에 관한 피드백 받기로 끝납니다. 이 피드백은 프로덕션 성능 지표나 제품 사용자의 피드백일 수 있습니다. 

 

파이프라인에는 데이터 전처리, 모델 학습과 모델 분석, 모델 배포 등 다양한 단계가 포함됩니다. 이런 단계를 수동으로 수행하기란 번거롭고 오류가 발생하기 쉽습니다. 

 

[그림 : 머신러닝 파이프라인 아키텍처]

 

파이프라인은 반복되는 주기입니다. 데이터를 지속적으로 수집할 수 있으므로 머신러닝 모델도 지속적으로 업데이트할 수 있습니다. 

 

일반적으로 데이터가 많을수록 모델이 개선됩니다. 이런 지속적인 데이터 유입 때문에 자동화가 핵심입니다. 실제 애플리케이션에서는 모델을 자주 재학습합니다. 그렇지 않으면 모델이 예측하는 새 데이터와 학습 데이터가 달라서 정확도가 낮아지겠죠. 

 

재학습이 새로운 학습 데이터를 수동으로 검증하거나 업데이트된 모델을 분석해야 하는 수동 프로세스일 때, 데이터 과학자나 머신러닝 엔지니어는 전혀 다른 비즈니스 문제에 적용할 새로운 모델을 개발할 시간을 내기 어렵습니다.

 

https://www.hanbit.co.kr/channel/category/category_view.html?cms_code=CMS8716308407&cate_cd= 

 

인공지능 프로젝트의 자동화⋯머신러닝 파이프라인이 뭔데?

언젠가 영화 속에서 등장했던 인공지능이란 단어가 어느덧 우리 곁에 가까이 다가와 자연스럽게 생활 속으로 스며들고 있습니다. 활발하게 연구되고 있는 자율주행차에도, 빠르게 확장되고 변

www.hanbit.co.kr

 

 

 

728x90

'07.AI' 카테고리의 다른 글

자연어처리 (NLP) - XLNet  (0) 2023.05.15
자연어처리 (NLP) - GloVe  (0) 2023.05.15
자연어처리 (NLP) - GPT-3  (0) 2023.05.09
자연어처리 (NLP) - SpanBERT  (0) 2023.05.09
자연어처리 (NLP) - ALBERT  (0) 2023.05.09
Posted by Mr. Slumber
,