How I Built and Shipped a Production-Ready AI Recommendation System (Nomova.ai)
개요
Nomova.ai는 예측 모델링과 클라우드 인프라를 활용하여 개인화된 여행 추천을 생성하는 AI/ML 기반의 여행 계획 플랫폼으로, 모델 개발부터 프로덕션 배포까지 엔드투엔드 AI 시스템 구축을 목표로 합니다.
주요 내용
- 문제점: 기존 여행 계획은 여러 플랫폼을 분산적으로 사용하며 높은 인지 부하, 일관성 없는 추천, 개인화 부족 등의 마찰을 야기했습니다. Nomova.ai는 이를 단일 AI 기반 추천 시스템으로 통합하여 해결합니다.
- 시스템 설계: 데이터 처리, 머신러닝, 서빙 인프라를 명확히 분리한 클라우드 네이티브 SaaS 아키텍처로 설계되었습니다.
- 머신러닝 레이어: PyTorch로 핵심 예측 기능을 구축하고 Vertex AI를 통해 모델을 배포하며, 사용자 선호 패턴 학습, 여행지 랭킹, 반복적인 모델 실험 및 튜닝을 담당합니다.
- 피처 처리 레이어: 원시 사용자 상호작용 데이터를 행동 이력, 목적지 친밀도, 예산/기간/선호도 등 컨텍스트 제약 조건과 같은 구조화된 신호로 변환하여 모델에 전달합니다.
- 클라우드 배포: Vertex AI를 사용하여 모델 서빙 및 인프라 관리를 수행하며, 확장 가능한 추론 엔드포인트, 관리형 배포 워크플로우, 단순화된 모델 수명 주기 관리를 가능하게 합니다.
- 엔지니어링 결정: ML 레이어, 피처 파이프라인, 서빙 인프라를 의도적으로 분리하여 독립적인 개발 및 반복을 지원했으며, Vertex AI를 사용하여 운영 오버헤드를 줄이고 수동 인프라 관리 없이 추론 워크로드를 확장했습니다.
- 주요 도전 과제: 신규 사용자의 상호작용 데이터 부족으로 인한 콜드 스타트 문제, 개인화와 일반적인 여행 관련성 간의 균형을 맞추는 모델 일반화, 로컬 개발에서 배포 시스템으로의 전환 과정에서의 추론 흐름 재구성 및 환경 간 일관성 확보가 있었습니다.
- 기술 스택: PyTorch, Google Vertex AI, Google Cloud Platform, Python 기반 ML 파이프라인을 사용했습니다.
시사점
Nomova.ai 프로젝트는 확장 가능하고 유지보수가 용이하며 실용적인 프로덕션 레디 AI 추천 시스템의 성공적인 구축 및 배포를 보여주며, 확장 가능한 ML 시스템 설계, 클라우드 네이티브 아키텍처 구축, 개발에서 프로덕션으로 모델 이전, 장기적인 유지보수를 위한 시스템 구조화 경험을 입증합니다.
원문을 불러오는 중...
댓글
GitHub Discussions