(개념) 반도체 파운드리 모델을 벤치마킹하여 데이터 생산·가공·관리를 전문적으로 수행하는 서비스로, 맞춤형 데이터 솔루션을 제공하는 새로운 비즈니스 형태
(등장배경) ‘데이터를 통해 성장하는 AI’, 넘치는 수요에 데이터 재고 고갈 위기
1) AI 데이터 수요 폭증 - 초거대 모델·멀티모달 AI·서비스 확산이 이끄는 기하급수적 증가
2) 데이터 수요 폭증으로 촉발된 공급 위기 - 2028년 소진 경고와 기업 간 쟁탈전 격화
1) 기존 AI 활용 학습 데이터의 구조적 문제
: 중복성, 편향성, 데이터 노이즈와 같은 기존 학습 데이터의 구조적 문제 대두
- (중복성) 인터넷에서 수집한 데이터의 대규모 중복 문제로 AI 학습의 비효율성이 심화, 새로운지식 습득보다 반복 학습이 증가하는 악순환
- (편향성) 특정 언어와 문화권에 치우친 데이터 분포로 인해 AI의 글로벌 활용성 제한, 다양성 부족 문제가 구조적으로 고착화
- (노이즈 오염) 웹페이지에서 추출한 텍스트에 각종 불필요한 요소들이 섞여 들어가면서 AI가학습해야 할 실제 콘텐츠의 품질이 심각하게 저하
2) 데이터 학습을 둘러싼 공급자-수요자 간 대립 구조 심화
: 데이터 양적 한계와 구조적 문제 심화로 AI 기업들은 더욱 적극적인 데이터 확보 전략을 추진, 이에 대응하여 데이터 보유 기업들은 자산 보호에 나서면서 양측 간 대립 구도 형성
3) 데이터 부족 해결을 위한 패러다임 전환, ‘대량 수집 → 고품질 데이터’ 중심
: AI 업계는 대량 수집에서 품질 중심 전략으로 패러다임을 전환하며, 합성 데이터 생성, 정밀 주석 작업, 기존 데이터 정제 등 새로운 돌파구 모색
4) 데이터 전문 공급 체계, ‘데이터 파운드리’ 부상
: AI의 데이터를 수집부터 활용까지 체계적으로 처리하는 통합 인프라로서핵심 경쟁력의 원천으로 부상
https://iitp.kr/kr/1/knowledge/policyDataViewB.it
지식정보 > 정기간행물 > ICT Brief > 상세정보 | IITP
잠시만 기다려 주시길 바랍니다.
iitp.kr
'07.AI' 카테고리의 다른 글
LLM - 알리바바, 제로서치(ZeroSearch) (2) | 2025.06.15 |
---|---|
기초 모델 (FM, Foundation Model) - 생성형 AI (5) | 2025.06.12 |
인공지능 - 합성 데이터 (Synthetic data) (4) | 2025.06.06 |
AI는 공정한가? AI면접의 문제점 (2) | 2025.05.24 |
인공지능 - 공공 AI 영향평가 (0) | 2025.05.21 |