Gestionnaire, plateforme infonuagique
Toronto, ON, CA, M5J 2V5 Edmonton, AB, CA Calgary, AB, CA Burnaby, BC, CA Vancouver, BC, CA Montréal, QC, CA Ottawa, ON, CA
Description
Notre équipe et ce que nous accomplirons ensemble
Nous sommes le plus important fournisseur de services de TI dans le domaine des soins de santé au Canada et nous transformons le secteur. L’équipe de la plateforme infonuagique de TELUS Santé est passionnée par la résolution de problèmes complexes pour simplifier la vie des patients, des cliniciens et des équipes qui les servent. Nous élaborons des plateformes infonuagiques natives sécurisées à grande échelle sur GCP, AWS et Azure — et nous sommes fiers de bien faire les choses.
Nous évoluons vers un modèle opérationnel axé sur les agents. Des agents IA — et non des humains — gèrent les tâches routinières : approvisionnement de l’infrastructure, réponse aux demandes, application des mesures de protection et orientation des équipes dans les flux de travail en libre-service. Le volet de la sécurité est intégré à tout ce que nous faisons, et non simplement ajouté à la fin. Nos ingénieurs mettent l’accent sur la création et l’amélioration de ces agents et systèmes, plutôt que sur l’exécution de tâches manuelles. Nous recherchons un leader qui comprend ce changement et qui sait comment en prendre la direction.
En tant que gestionnaire, plateforme infonuagique, vous dirigerez nos fonctions d’ingénierie de plateforme et d’exploitation infonuagique. Le libre-service sur la plateforme est notre priorité absolue, et les flux de travail axés sur les agents sont le moyen d’y parvenir. Votre mandat consiste à créer les systèmes — agents, parcours modèles, cadres d’automatisation et mesures de sécurité — qui permettent aux équipes de produit et d’ingénierie d’interagir avec la plateforme infonuagique entièrement par l’intermédiaire d’interfaces pilotées par l’IA, sans jamais avoir besoin de produire un ticket ou d’attendre une intervention humaine.
La sécurité est une préoccupation de premier ordre pour ce poste. Vous serez responsable de la posture de sécurité de la couche de plateforme — en veillant à ce que l’identité, l’accès et les contrôles de conformité sont appliqués automatiquement par le code et les agents, plutôt que par un examen manuel. Il s’agit d’un double mandat : bâtir la plateforme axée sur les agents qui élimine les tâches opérationnelles fastidieuses, tout en faisant en sorte que la plateforme demeure sécurisée, conforme et digne de confiance pour l’organisation.
Ce que vous ferez
Bâtir la plateforme axée sur les agents
-
Concevoir et diriger la mise en place d’un modèle opérationnel de plateforme axé sur les agents — où les agents IA (Claude, GitHub Copilot et des agents personnalisés) constituent l’interface principale entre les équipes produit et l’infrastructure infonuagique
-
Remplacer les flux de travail manuels associés aux tickets par un traitement des demandes piloté par des agents : les développeurs décrivent ce dont ils ont besoin en langage naturel ou via l’interface de ligne de commande (CLI), et les agents génèrent, valident et appliquent les modifications de Terraform ou de configuration requises
-
Créer des flux de travail d’agents qui guident les équipes produit tout au long de l’intégration à l’infrastructure, des demandes d’accès, de l’amorçage d’environnement et des vérifications de conformité — sans nécessiter l’intervention de l’équipe de la plateforme infonuagique
-
Implanter GitHub comme colonne vertébrale opérationnelle : les problèmes, les demandes de fusion, la documentation et les interactions avec les agents suivent tous un modèle natif de GitHub
-
Doter les agents d’une connaissance des normes relatives à la plateforme, des mesures de sécurité et du contexte organisationnel — afin qu’ils appliquent la politique automatiquement au lieu de transférer la responsabilité aux humains
-
Définir et communiquer la feuille de route des agents aux cadres supérieurs, aux équipes d’ingénierie et aux parties prenantes des produits
Prendre en charge la sécurité et la conformité de la plateforme
-
Assumer la responsabilité de la situation sur le plan de la sécurité de la couche de la plateforme infonuagique — en veillant à ce que les contrôles d’identité, d’accès et de réseau soient mis en œuvre de manière cohérente et appliqués grâce à l’automatisation sur GCP, AWS et Azure
-
Mettre en œuvre et maintenir des mesures de sécurité aux niveaux de l’organisation et du pipeline, en veillant à ce que toute infrastructure approvisionnée par la plateforme respecte les exigences de base en matière de sécurité et de conformité
-
Diriger la gouvernance de la gestion des identités et des accès (IAM) : liaison des rôles, approvisionnement des accès, rotation des clés, gestion des comptes de service et fédération d’identité de charge de travail — avec pour objectif d’automatiser ces contrôles grâce aux agents et à la politique sous forme de code
-
Collaborer avec l’équipe de sécurité pour garantir que les capacités de la plateforme sont conformes aux normes de sécurité de l’organisation et prennent en charge les exigences d’audit (pratiques conformes aux normes SOC 2, à la LPRPDE et à la loi HIPAA)
-
Intégrer la sécurité dans les parcours modèles en libre-service — afin que les équipes qui approvisionnent l’infrastructure via des modèles approuvés héritent automatiquement de valeurs par défaut sécurisées
-
Traiter les résultats de sécurité comme des problèmes d’ingénierie : prioriser la remédiation par le code, l’automatisation et l’application par les agents plutôt que par des cycles d’examen manuels
Prendre en charge la plateforme en libre-service et les parcours modèles
- Concevoir des cadres de « parcours modèles » rigoureux utilisant Terraform, Terragrunt et GitHub Actions qui standardisent et sécurisent les modèles d’infrastructure sur GCP, AWS et Azure
-
Construire et maintenir un marché de modules centralisé et une bibliothèque d’infrastructure sous forme de code que les équipes et les agents peuvent utiliser en toute confiance
-
Veiller à ce que toutes les capacités en libre-service soient accessibles aux agents — conçues pour une utilisation humaine et programmatique dès le premier jour
-
Établir des limites de soutien claires : les équipes utilisant le parcours modèle bénéficient d’un soutien complet; les configurations non standard sont prises en charge par les équipes elles-mêmes
Diriger les opérations infonuagiques
-
Assurer une couverture opérationnelle sur l’ensemble de l’écosystème multi-infonuagique : GCP, AWS et Azure
-
Diriger la gestion des incidents en mettant l’accent sur la remédiation durable — chaque incident important produit des guides d’exécution pour les agents, de l’automatisation ou de la documentation permettant d’éviter la récurrence
-
Réduire le nombre de demandes grâce au libre-service piloté par les agents, et non par l’augmentation des effectifs — traiter le nombre élevé de tickets comme un problème d’ingénierie à automatiser
-
Coordonner avec les équipes de fiabilité des sites (SRE) et d’observabilité pour s’assurer que les services de plateforme répondent aux attentes en matière de fiabilité et que les incidents sont acheminés et résolus efficacement
Stimuler l’excellence en ingénierie
- Bâtir et maintenir des pipelines CI/CD et l’infrastructure sous forme de code pour automatiser l’approvisionnement, la gestion de la configuration, la correction des vulnérabilités et l’application de la conformité
-
Contribuer à l’initiative de fabrique d’images modèles — en s’assurant que des images de base renforcées CIS et corrigées sont disponibles à la demande sur toutes les plateformes infonuagiques
-
Promouvoir une mentalité de « sécurité sous forme de code » au sein de l’équipe — l’application des politiques, les vérifications de conformité et les contrôles d’accès sont mis en œuvre dans les pipelines et les agents, et non dans des feuilles de calcul
Diriger, coacher et développer votre équipe
-
Gérer une équipe mixte d’ingénieurs de plateforme et d’ingénieurs en exploitation infonuagique, en mettant délibérément l’accent sur le développement des compétences en création d’agents, en automatisation et en ingénierie de la sécurité
-
Embaucher des ingénieurs stimulés par la création de systèmes pilotés par l’IA et axés sur la sécurité — et non seulement par l’exploitation de systèmes existants
-
Favoriser une culture d’apprentissage — créer un espace pour que l’équipe puisse se développer dans le développement axé sur les agents, la sécurité infonuagique, les certifications et l’infrastructure sous forme de code en plus de ses responsabilités quotidiennes
-
Aider à façonner et à faire évoluer les cérémonies d’équipe et les méthodes de travail, et contribuer à la manière dont l’équipe structure son rythme de livraison, ses rétrospectives et sa planification sans être le seul déterminant de l’exécution
Collaborer à l’échelle de l’organisation
-
Collaborer avec les équipes de produit, d’ingénierie, de sécurité et d’architecture pour harmoniser les capacités de la plateforme et des agents avec les priorités organisationnelles
-
Agir en tant que champion interne des flux de travail axés sur les agents — aider les équipes produit et d’ingénierie à comprendre comment interagir avec la plateforme par l’intermédiaire d’agents plutôt que par des processus manuels
-
Rendre compte de l’adoption de la plateforme, de l’utilisation des agents, de la situation sur le plan de la sécurité et des progrès réalisés dans la réduction des tâches fastidieuses auprès des cadres supérieurs
Qualifications
Ce dont vous aurez besoin
Leadership et mentalité
-
5 ans et plus d’expérience progressive en ingénierie de plateforme infonuagique ou en exploitation infonuagique — avec au moins 2 ans dans un rôle de gestion de personnel ou de leadership technique
-
Une croyance authentique dans les flux de travail axés sur les agents et la sécurité, ainsi qu’une expérience éprouvée dans le développement de l’automatisation pour remplacer les processus manuels — non pas simplement pour les compléter
-
De l’expérience dans la direction d’équipes intervenant sur le plan de transformations : passage d’une approche privilégiant des opérations réactives axées sur les tickets à une plateforme proactive axée sur les agents
-
Solides compétences en communication — capable de traduire la complexité de la plateforme en récits clairs pour la haute direction et les parties prenantes de l’entreprise
-
À l’aise avec l’ambiguïté et la conduite du changement dans un environnement en constante évolution
Profondeur technique
-
Expérience pratique avec au moins deux des plateformes suivantes : GCP, AWS et Azure —solide compréhension de l’identité, du réseautage, du calcul et des contrôles de sécurité à grande échelle
-
Expertise approfondie de l’infrastructure en tant que code (Terraform, Terragrunt) et capacité à concevoir des bibliothèques de modules sécurisées, réutilisables et cohérentes
-
Expérience dans la création ou l’utilisation d’agents IA et de flux de travail axés sur les agents — incluant l’ingénierie de requêtes, l’utilisation d’outils et l’intégration d’agents avec les systèmes de CI/CD et les API d’infrastructure
-
Solide compréhension des fondamentaux de la sécurité infonuagique : IAM, RBAC, comptes de service, fédération d’identité de charge de travail, sécurité réseau et gestion des secrets
-
Expérience dans la mise en œuvre de politiques en tant que code et l’application automatisée de la conformité dans des environnements multinuages
-
Maîtrise d’au moins un langage de script ou de programmation (Python, Go, Bash) — vous écrivez du code, pas seulement en YAML
-
Expérience dans la création de plateformes libre-service destinées aux développeurs, incluant des outils CLI, des flux de travail GitHub Actions et des interfaces basées sur la discussion
Excellence opérationnelle
-
Expérience éprouvée dans la réduction des tâches opérationnelles répétitives grâce à l’automatisation — avec des exemples concrets de ce que vous avez construit et de la façon dont cela a permis de réduire la charge de travail de manière mesurable
-
Expérience dans la gestion des interventions en cas d’incident à grande échelle, incluant la facilitation de bilans rétrospectifs et le suivi des mesures correctives
-
Connaissance des pratiques de gestion des demandes et des flux de travail — et un instinct pour traiter le nombre élevé de demandes comme un problème d’ingénierie à automatiser
-
Compréhension des exigences de sécurité et de conformité dans les environnements de soins de santé réglementés (SOC 2, pratiques conformes à la loi HIPAA et à la LPRPDE)
Formation et certifications
- Baccalauréat en informatique, en génie ou dans un domaine technique connexe — ou expérience pratique équivalente
-
Certifications infonuagiques (requises — au moins une) : AWS Solutions Architect (associé ou professionnel), GCP Professional Cloud DevOps Engineer ou Azure Administrator Associate
-
Certifications infonuagiques (souhaitées — supplémentaires) : GCP Professional Cloud Architect, AWS DevOps Engineer Professional, Azure DevOps Engineer Expert
-
Développement et exploitation / Plateforme : CKA (administrateur Kubernetes certifié) ou titre de compétence équivalent au niveau praticien est un atout important
Atouts
-
Expérience dans la conception ou l’exploitation de systèmes axés sur les agents dans un contexte d’ingénierie de production — incluant l’utilisation d’outils de GML, l’orchestration d’agents ou l’automatisation des flux de travail pilotée par l’IA
-
Connaissance de GitHub Copilot, Claude ou d’outils de codage/opérations par IA similaires dans un cadre d’entreprise
-
Expérience des outils de gestion de l’état de sécurité dans le nuage de TELUS et de l’intégration des résultats de sécurité dans les flux de travail de correction automatisés
-
Expérience dans le soutien de programmes de modernisation de l’infrastructure à grande échelle ou d’adoption du nuage
-
Expérience en matière de fédération d’identité et d’administration de l’authentification unique (SSO) dans des environnements multinuages
-
Expérience dans le domaine des TI de soins de santé réglementés — compréhension des systèmes cliniques ou destinés aux patients
-
Expérience avec les principes FinOps et l’attribution des coûts infonuagiques
-
Connaissance des outils de collaboration et de développement en entreprise, tant en tant qu’utilisateur qu’en tant qu’administrateur
Une connaissance avancée de l'anglais est requise, car vous serez appelé(e) la plupart du temps à interagir en anglais avec des parties internes (par ex. collègues ou parties prenantes); et à travailler dans un environnement informatique anglais dans le cadre des tâches liées à ce poste dont la portée est nationale.
#LI-REMOTE