Data-Centric AI
- 데이터의 중요성
- AI System = Code + Data
- 데이터는 곧 모델을 학습하는 데에 필요한 재료
- 동일한 데이터에 대해 서로 다른 어노테이션/라벨을 다는 경우가 발생 ⇒ 노이즈 발생
Data-Centric AI의 정의
- 2020년대에 들어서 주목받기 시작한 AI 접근 방식으로, 개발 및 운용의 관점에서 데이터를 중심으로 접근하는 방식
- Model-Centric AI : 과거 그리고 지금도 여전히 가장 주로 사용되는 AI 접근 방식으로, 개발 및 운용의 관점에서 모델을 중심으로 접근하는 방식
Model-Centric AI vs. Data-Centric AI
코드를 개선하면 Model-Centric AI, 데이터를 개선하면 Data-Centric AI라고 이해할 수 있음
- Model-Centric AI
- 최대한 많은 데이터를 확보한 뒤, 이러한 데이터의 노이즈에 대응할 수 있는 모델을 개발
- 데이터를 고정시킨 상태로 알고리즘/모델을 반복적으로 개선해나감
- Data-Centric AI
- 데이터의 통일성(consistency)를 위해 다양한 도구를 이용하여 체계적으로 데이터의 품질을 향상
- 코드를 고정시킨 상태로 데이터를 반복적으로 개선해나감
AI 서비스 개발 과정
- AI 서비스 개발 과정 - 서비스 출시 전
- AI 서비스 개발 과정 - 서비스 출시 후
MLOps
- MLOps (Machine Learning Operations) = ML + DevOps
- 머신러닝 모델을 안정적이고 효율적으로 배포하고 유지 관리하는 것을 목표로 하는 패러다임 - MLOps (Machine Learning Operations) ⊃ DataOps
- 데이터셋 구축을 위한 인프라를 만들어 데이터를 체계적이고 효율적으로 관리할 수 있는 시스템이기도 함
'Study > Data Centric' 카테고리의 다른 글
데이터 구축 프로세스 (0) | 2025.02.18 |
---|---|
Data-Centric AI의 미래 (1) | 2025.02.18 |
Data-Centric AI가 산업에 미친 영향 (1) | 2025.02.18 |