Study/Data Centric

Data-Centric AI

김 도경 2025. 2. 17. 10:37
Data-Centric AI
  • 데이터의 중요성
    - AI System = Code + Data
    - 데이터는 곧 모델을 학습하는 데에 필요한 재료
    - 동일한 데이터에 대해 서로 다른 어노테이션/라벨을 다는 경우가 발생 ⇒ 노이즈 발생
Data-Centric AI의 정의

- 2020년대에 들어서 주목받기 시작한 AI 접근 방식으로, 개발 및 운용의 관점에서 데이터를 중심으로 접근하는 방식

-  Model-Centric AI : 과거 그리고 지금도 여전히 가장 주로 사용되는 AI 접근 방식으로, 개발 및 운용의 관점에서 모델을 중심으로 접근하는 방식

 

Model-Centric AI vs. Data-Centric AI

코드를 개선하면 Model-Centric AI, 데이터를 개선하면 Data-Centric AI라고 이해할 수 있음

- Model-Centric AI
    -  최대한 많은 데이터를 확보한 뒤, 이러한 데이터의 노이즈에 대응할 수 있는 모델을 개발
    -  데이터를 고정시킨 상태로 알고리즘/모델을 반복적으로 개선해나감

- Data-Centric AI
    -  데이터의 통일성(consistency)를 위해 다양한 도구를 이용하여 체계적으로 데이터의 품질을 향상
    - 코드를 고정시킨 상태로 데이터를 반복적으로 개선해나감

 

AI 서비스 개발 과정

- AI 서비스 개발 과정 - 서비스 출시 전

 

- AI 서비스 개발 과정 - 서비스 출시 후

 

MLOps
  • MLOps (Machine Learning Operations) = ML + DevOps
    - 머신러닝 모델을 안정적이고 효율적으로 배포하고 유지 관리하는 것을 목표로 하는 패러다임

  • MLOps (Machine Learning Operations) ⊃ DataOps
    - 데이터셋 구축을 위한 인프라를 만들어 데이터를 체계적이고 효율적으로 관리할 수 있는 시스템이기도 함

'Study > Data Centric' 카테고리의 다른 글

데이터 구축 프로세스  (0) 2025.02.18
Data-Centric AI의 미래  (1) 2025.02.18
Data-Centric AI가 산업에 미친 영향  (1) 2025.02.18