1. Augmenter cache Redis (2GB → 4GB)
Doubler capacité Redis pour améliorer hit rate 68% → 92%. Coût +€48/mois. Latence -40ms estimée.
🎯 Priorité : Critique⏱️ Délai : 24h💰 ROI : -40ms latence
2. Rate limiting /api/predict (800 req/min/IP)
Protéger endpoint predict avec throttling 800 req/min/IP pour éviter surcharge. Nginx limit_req.
🎯 Priorité : Haute⏱️ Délai : 48h
3. Query batching API predict
Permettre batch predict (max 10 items/request) pour réduire overhead HTTP. Latence -30%.
🎯 Priorité : Haute⏱️ Délai : 2 semaines
4. Warm-up Lambda functions
Provisioned concurrency (5 instances) pour éliminer cold starts Lambda. Coût +€72/mois.
🎯 Priorité : Moyenne⏱️ Délai : 1 semaine
5. Monitoring Datadog + alertes P95
Dashboard temps réel + alertes Slack si P95 >80ms. Prévention incidents futurs.
🎯 Priorité : Haute⏱️ Délai : Immédiat