Le pendule DevOps : agilité contre. Contrôle
Par : Cindy Blake le 2 août 2023
La gestion des modifications apportées aux actifs cloud est aujourd'hui une douleur universelle ressentie par de nombreux responsables de l'ingénierie, malgré toutes les avancées en matière d'outils et de pratiques telles que GitOps. En effet, en réalité, il est tout simplement impossible de toujours tout verrouiller complètement : nous ne vivons pas dans une utopie sans incident. Si votre organisation d'ingénierie empêche toute modification via la console cloud ou sur votre infrastructure en tant que code (IaC) sans se conformer aux pratiques GitOps strictes ou aux processus de gestion des modifications via CI/CD, il est probable que vous ayez des développeurs très frustrés. qui ne peuvent pas dépanner ou déboguer en temps réel et qui ont peu de contrôle sur un incident réel.
L’ingénierie, comme tout le reste dans la vie, est une question d’équilibre.
La pandémie a créé un tout nouvel état d’esprit et de nouvelles pratiques en matière de gestion de l’ingénierie et des opérations distribuées et à grande vitesse. Du jour au lendemain, les entreprises qui n'étaient pas conçues pour les méthodes de travail à distance ont dû poursuivre leurs opérations de manière globale, distribuée et asynchrone avec laquelle elles n'étaient pas tout à fait familiarisées. Cela a nécessité une nouvelle façon de penser la livraison de logiciels et a accéléré les pratiques DevOps qui prennent en charge cette livraison. L'infrastructure en libre-service a supprimé les obstacles pour les développeurs afin de garantir des performances et une rapidité continues.
Dans le même temps, votre cloud ne peut pas être le Far West où tout le monde crée une infrastructure sur mesure. Cela devient impossible à gérer et des erreurs de configuration peuvent être risquées. Les garde-fous et l’automatisation des politiques sont devenus un sujet brûlant. Aujourd’hui, alors que les marchés technologiques sont déprimés et que les coûts du cloud augmentent, il semble y avoir une tendance croissante à verrouiller à nouveau les choses, même au risque de frustrer les développeurs.
Cela soulève la question suivante : comment pouvez-vous obtenir une infrastructure sans entrave pour vos développeurs tout en suivant simultanément les politiques et les meilleures pratiques en matière de conformité, de risque et de coût ? Il existe un moyen de trouver un équilibre.
Comme pour de nombreux aspects de la sécurité, nous avons appris que lorsque les contraintes et les barrières sont trop élevées, les utilisateurs finissent par trouver des moyens de les contourner. Cela est également vrai pour les opérations. Bien qu’il puisse parfois sembler plus facile de tout verrouiller que de concevoir une manière meilleure et plus équilibrée de permettre aux développeurs d’avancer rapidement, cette approche finit par se retourner contre eux. Il s’agit exactement de la même évolution que connaît actuellement le secteur des applications et de la sécurité cloud native. Tous les garde-fous et contrôles appliqués ont créé trop de frictions dans les processus de développement et les développeurs finissent par les contourner.
CloudOps peut apprendre beaucoup des perturbations que traverse aujourd’hui le secteur de la sécurité. De la même manière que la sécurité ponctuelle est devenue complètement inutile, les alertes en différé ou les alertes éventuelles en cas de dérive de l'infrastructure ne suffiront tout simplement pas lors de la gestion d'un cloud éphémère. Ce qui est réellement nécessaire, c'est le même type d'analyse continue et en temps réel des actifs cloud et de l'IaC, similaire à ce que nous appliquons à nos systèmes via la surveillance et l'observabilité. Ces solutions sont devenues une épine dorsale essentielle de notre activité pour garantir la continuité des opérations et la disponibilité des services cloud.
À mesure que nous adoptons l’IaC et les avantages qu’elle apporte, le tout en tant que code offre une plus grande agilité et une plus grande visibilité, vous permettant d’effectuer automatiquement des corrections sans tout verrouiller. Comme le dit DevOps, « échouez et échouez rapidement ». Plutôt que de vous concentrer sur le fait de ne jamais commettre d’erreur, concentrez-vous sur la manière de la corriger immédiatement.
En fournissant une comparaison continue des actifs cloud réels avec leur état souhaité via IaC et GitOps, il est possible de détecter immédiatement les dérives de configuration et les violations de politiques, un peu comme tout autre type de violation ou de panne système majeure. Les échecs et les incidents sont inévitables. Il est irréaliste, voire dangereux, de créer des systèmes avec une conception sous-jacente inhérente qui vous empêche de modifier quelque chose sur la console cloud à 2h00 du matin lors d'une panne.
