Stabilisation d’une plateforme sans documentation

yco

Contexte de la mission

y.co est une société proposant des services pour le secteur du yachting ultra luxe (location et vente).

Problématique/État des lieux :

La plateforme technique d’affichage des offres de location et de vente souffrait de multiples dysfonctionnements :

  • Instabilité chronique : La plateforme était très instable, avec des interruptions de service hebdomadaires.
  • Architecture non maîtrisée : L’architecture AWS a été développée par plusieurs prestataires sans expertise AWS avérée, et sans production de documentation.
  • Déploiement manuel et non reproductible : L’infrastructure et les logiciels avaient été installés « à la main », rendant toute reproduction (et donc toute industrialisation) impossible.
  • Coûts non optimisés : L’infrastructure et les opérations engendraient des coûts non maîtrisés.

Solution mise en oeuvre

Après une première phase d’audit qui a relevé des points critiques de défaillance, l’équipe d’experts d’Ynpact a proposé un plan de remise à niveau en plusieurs étapes pour améliorer la stabilité de la plateforme rapidement.

Phase 1 : Les optimisations rapides (Quick Wins)

  • Résilience de l’indexation : Déploiement d’un mécanisme de bascule DNS (failover DNS) pour les pages dynamiques afin d’éviter la perte de classement Google en cas de défaillance.
  • Performance du CDN : Réduction du Time-To-Live (TTL) du CDN CloudFront à 24 heures pour les chemins d’API (API paths).
  • Stabilité de la charge : Correction du problème de « persistance de session » (stickiness) de l’Équilibreur de Charge (ELB).

Phase 2 : Mise à niveau et sécurisation en profondeur

Cette étape a nécessité un investissement en temps plus important en raison de la correction de plusieurs points de défaillance, dont certains critiques.

  • Sécurité et Organisation des Comptes (AWS) :
    • Séparation des comptes AWS (comptes root, log, production, etc.) en conformité avec les meilleures pratiques de sécurité AWS.
  • Haute Disponibilité (Redondance Physique et Logique) :
    • Architecture Applicative : Mise en place d’une architecture Multi-AZ (zones de disponibilité multiples) pour garantir une redondance physique multisites des machines virtuelles.
    • Isolation des Services : Séparation des différents services dans des sous-réseaux (sub-nets) publics et privés.
    • Bases de Données : Déploiement d’une architecture Multi-AZ pour les bases de données, assurant une redondance physique multisites critique.
  • Résilience et Supervision :
    • Réparation Automatique : Implémentation d’Auto Scaling Groupes pour le redémarrage automatique des machines en cas de panne ou de plantage.
    • Monitoring : Mise en place d’une supervision centralisée via CloudWatch.
    • Documentation : Formalisation de l’ensemble de la nouvelle infrastructure.

Bénéfices et impact

  • Stabilité Optimale : Élimination totale des interruptions de service.
  • Sécurité Renforcée : Amélioration significative du niveau de sécurité de la plateforme.
  • Efficacité Opérationnelle : Déploiement automatisé grâce à l’adoption d’une approche Infrastructure as Code (IaC).

Optimisation Financière : Réduction de 50 % des coûts de la plateforme.