728x90
반응형

빅데이터 경쟁력 강화요건

▲활용 가능한 양질의 데이터 확보 

▲빅데이터 산업 활성화를 위한 플랫폼의 뒷받침 

▲전문인력 양성 등

 

데이터 큐레이터의 부상

데이터 큐레이터는 데이터 소비자(태블로나 파이썬 같은 툴을 사용해, 데이터로 중요한 질문의 답을 찾는 데이터 과학자와 분석가)와 데이터 엔지니어(스파크와 하이브, 맵리듀스 같은 스크립팅 언어를 사용해 시스템 간 데이터를 이동시키는 사람들) 중간에 위치한다. 유능한 데이터 큐레이터가 되려면 데이터의 의미는 물론 데이터에 적용되는 기술을 이해해야 한다.

 

 

C레벨 경영진이 중요하게 챙길 데이터 거버넌스 전략

 

EU GDRP(General Data Protection Regulation, 개인 정보 보호 규정)이 2015년 3월 8일부로 발효된다. 이는 분석과 관련된 분야에 많은 영향을 초래한다. 그러나 여기에 준비되지 않은 기업들이 존재하는 실정이다.

 

‘메타데이터 관리’ 확산 지속

 

GDPR만이 아니다. ‘데이터 범람’이 계속 확산되고 있는 추세이고, 이에 세계 각국 정부들이 새로운 규제를 부과하고 있다. 기업 내 여러 팀들이 과거 어느 때보다 많이 데이터에 접근해 이를 활용하고 있다. 이에 데이터 거버넌스, 데이터 품질, 메타데이터 관리의 중요성이 높아졌다.

 

유의미한 인사이트를 추출하고, 운영 성과를 높이기 위해서는, 사용자가 신속하게 데이터를 획득, 준비, 분석, 관리하는 유연한 통합 도구가 필요하다. 특히 메타데이터 관리는 기업 데이터 환경에서의 데이터 관리 수요, 규제 준수, 데이터 거버넌스를 지원하는 필수적인 역할을 할 전망이다.

 

 

데이터 품질 개선에 도움을 주는 예측 분석

데이터 프로젝트가 ‘생산화’ 단계로 발전하면, 데이터 품질이 아주 중요해진다. IoT로 데이터가 더 폭증할 것이라는 점을 감안했을 때 특히 중요하다. 인포직스에 따르면, 2018년 기업들은 데이터 품질의 ‘이상’을 더 효과적으로 감지하기 위해 머신러닝 알고리즘을 찾을 전망이다. 역사적인(기존) 패턴으로 미래의 데이터 품질을 예측, 놓치거나 (수동으로 개입을 했을 때)훨씬 나중에 발견할 수 있는 ‘이상’을 파악할 수 있다는 생각에서다.

 

(http://www.ciokorea.com/news/37617)

 

 

 

'빅데이터 거버넌스' 구조를 보여주는 프레임워크. 큐브 전면의 각 셀은 산업유형(Y축)에 따른 빅데이터(X축) 유형별 서비스 형태를 보여준다. 이를테면 헬스케어 산업에서 생체정보 빅데이터는 유전자검사 서비스로 구현되는 셈이다. Z축은 이들 정보에 대한 거버넌스 요소를 보여준다. 사진 제공/조완섭 충북대 경영정보학과 교수

 

(http://www.newstomato.com/ReadNews.aspx?no=778465)

728x90
Posted by Mr. Slumber
,