Appearance
Local LLM 서빙부터 AWS EKS 배포, 성능 최적화, 비용 분석까지 — 실습 기반 LLM 서비스 운영 학습
Ollama / vLLM 기반 로컬 모델 서빙 + FastAPI OpenAI-compatible 백엔드 구성
Terraform으로 VPC / GitLab EC2 / EKS 클러스터 구성 및 GitLab CI/CD 파이프라인 연동
Locust 부하 테스트, Redis cache, Streaming response, Prometheus/Grafana 모니터링