[MLOps] CI / CD / CT / CM

MLOps의 핵심인 CI/CD/CT/CM을 통해 머신러닝 모델의 개발, 배포, 학습, 모니터링 전 과정을 자동화하고 안정적으로 운영하는 방법을 소개합니다.

개요

MLOps에 지속적 통합(CI), 지속적 배포(CD), 지속적 학습(CT), 그리고 지속적 모니터링(CM)을 적용하는 방법에 대한 포괄적인 내용을 정리하였습니다. 이러한 Operation 관행을 통해 MLOps의 근간을 확인하고 개발, 배포, 관리까지를 가능하게 하는 방법을 확인합니다.

CI in MLOps

코드, 데이터, 머신러닝 모델이 원활하게 공유 레포지토리에 통합할 수 있게 합니다.

자동화된 코드 및 모델 통합:

버전 제어:

자동화된 테스트:

CI는 충돌과 코드 오류를 최소화할 뿐만 아니라 각 구성 요소를 철저히 테스트하고 검증함으로써 견고하고 확장 가능한 프로덕션 시스템의 기반을 마련합니다.

CD in MLOps

자동 모델 배포:

Infra as a Code:

배포 전략 구성:

롤백 메커니즘:

CI와 통합:

CT in MLOps

머신러닝 모델이 새로운 데이터가 도착하여 재학습할 때마다 최신 상태로 유지하는데 중점을 둡니다.

자동화된 재훈련 파이프라인:

데이터 버전 관리:

하이퍼파라미터 튜닝과 실험:

클라우드, 분산 컴퓨팅 서비스:

모델 검증 및 테스트:

CM in MLOps

배포된 모델이 프로덕션에서 실시간으로 안정적이고 예상대로 동작하는지 확인하기 위해 사용합니다.

실시간 모니터링:

데이터 및 모델 드리프트 감지:

자동 알림 및 통지:

로깅 및 감사:

피드백 루프: