À propos de Tigo
Tigo est le leader mondial de l'électronique de puissance au niveau du module (Flex MLPE) avec des solutions innovantes qui améliorent considérablement la sécurité, augmentent la production d'énergie et diminuent les coûts d'exploitation des systèmes photovoltaïques (PV). La plateforme TS4 de Tigo maximise les avantages des systèmes PV et offre aux clients la solution MLPE la plus évolutive, la plus polyvalente et la plus fiable qui soit.
Tigo a été fondé dans la Silicon Valley en 2007 pour accélérer l'adoption de l'énergie solaire dans le monde. Les systèmes de Tigo fonctionnent sur 7 continents et produisent quotidiennement des gigawattheures d'énergie solaire fiable, propre, abordable et sûre.
Nous avons besoin de personnes de premier ordre qui ont la passion de résoudre des problèmes complexes et d'apporter l'énergie renouvelable aux masses. Les membres de l'équipe bénéficient de salaires gratifiants, d'excellents avantages sociaux, d'une culture de travail décomplexée et de la satisfaction de contribuer à réduire la dépendance du monde à l'égard des combustibles fossiles. Nous travaillons dur en sachant que nos résultats auront un impact sur le caractère abordable, la fiabilité et la sécurité des systèmes d'énergie propre et renouvelable.
Description du poste
Contribuez à façonner l'avenir de l'intelligence énergétique en développant et en exploitant l'infrastructure qui sous-tend les prévisions IA/ML (Predict⁺) et la plateforme mondiale de surveillance solaire (Tigo EI) de Tigo. Nous sommes encore une équipe internationale relativement petite, qui fonctionne selon la mentalité d'une start-up : décisions rapides, forte implication et collaboration étroite entre les différents services.
Ce sur quoi vous travaillerez
Vous ferez partie d'une petite équipe DevOps pratique qui gère l'infrastructure derrière :
- Predict⁺ – Prévisions basées sur l'IA/ML pour la production et la consommation d'énergie.
- Tigo Energy Intelligence (EI) – une plateforme de surveillance et d'analyse utilisée dans plus de 100 pays.
- Nous exploitons un environnement hybride : cloud Azure et serveurs physiques (Hetzner + salles de serveurs sur site), avec Talos Kubernetes, une observabilité moderne et GitOps.
Aperçu du rôle
En tant qu'ingénieur DevOps senior, vous serez amené à :
- Exploiter et faire évoluer nos plateformes Kubernetes (Talos sur bare metal, AKS sur Azure).
- Propre infrastructure en tant que code et livraison basée sur GitOps.
- Améliorez la fiabilité, l'observabilité (OTEL), la sécurité et la rentabilité des systèmes de production.
- Travaillez au sein d'une équipe entièrement à distance, internationale et hautement asynchrone, avec beaucoup d'autonomie et de responsabilité.
Responsabilités
Kubernetes et infrastructure
- Exploiter et améliorer les clusters bare metal basés sur Talos et Azure AKS.
- Gérer les déploiements, les mises à niveau, la mise à l'échelle, la sauvegarde/restauration et le dépannage.
- Contribuer au renforcement de la sécurité (RBAC, politiques réseau, hygiène des images/secrets).
Cloud et bare metal (Azure + Hetzner + sur site)
- Aidez à gérer les abonnements Azure, la mise en réseau, l'identité et les bases de référence en matière de sécurité.
- Travailler avec des serveurs bare metal (Hetzner + sur site) et la connectivité entre ceux-ci et Azure (VPN, routage).
- Prise en charge de la planification des capacités et des conceptions tenant compte des coûts.
IaC, automatisation et livraison
- Utilisez Terraform comme source fiable pour l'infrastructure.
- Utilisez Ansible pour la configuration et le provisionnement reproductible.
- Construisez et maintenez des pipelines CI/CD avec GitLab CI et Azure DevOps auto-hébergés.
- Mettre en œuvre et exploiter GitOps avec Argo CD et GitLab autogéré.
Observabilité, données et réponse aux incidents
- Étendre et maintenir Prometheus, Grafana, Zabbix et OpenTelemetry (OTEL) pour les métriques, les journaux et les traces.
- Travaillez avec PostgreSQL et ClickHouse auto-hébergés, ainsi qu'avec Kafka, Redis et pub/sub / advanced queuing.
- Aider à définir les alertes, les SLO et les runbooks ; participer aux revues d'astreinte et post-incident.
Sécurité et conformité
- Appliquer les pratiques DevOps conformes à la norme ISO 27001 (accès, journalisation, gestion des changements, sauvegardes).
- Contribuer à la gestion des secrets, à l'accès avec le moins de privilèges possible et au renforcement des images/infrastructures.
Exigences
Vous n'avez pas besoin de tous ces éléments, mais vous devriez vous reconnaître dans la plupart d'entre eux :
- Expérience avec Azure (abonnements, réseau de base, identité, concepts de sécurité).
- Plus de 4 ans d'expérience dans des postes DevOps / SRE / Infrastructure avec une réelle responsabilité en matière de production.
- Solide expérience pratique avec Kubernetes (auto-hébergé et/ou AKS).
- Solide expérience avec Terraform et Ansible.
- Expérience dans la création et l'exécution de CI/CD avec GitLab CI et/ou Azure DevOps.
- Solides connaissances fondamentales de Linux et compétences en dépannage.
- Bonne compréhension des réseaux (TCP/IP, DNS, VPN, équilibreurs de charge, pare-feu).
- Connaissance de Prometheus / Grafana / Zabbix ou d'outils de surveillance similaires.
- Scripts en Bash et/ou Python.
- Excellentes compétences en communication et très bonne maîtrise de l'anglais écrit et parlé.
- À l'aise pour travailler au sein d'une équipe internationale entièrement à distance et asynchrone, et capable de prendre en charge son travail avec un minimum d'encadrement.
- Disponibilité pour participer à un roulement de production sur appel.
Bon à avoir
- Exploitation de systèmes SaaS ou énergie/IoT distribués à l'échelle mondiale et destinés aux clients.
- Utilisation en production d'OpenTelemetry (OTEL) et des piles d'observabilité modernes.
- Mise en pratique avec Talos Kubernetes et configurations hybrides Azure + bare metal.
- GitOps à grande échelle avec Argo CD et GitLab autogéré (SCM, runners, registre).
- Exploitation de ClickHouse à grande échelle (sauvegarde/restauration, performances, conservation).
- Keycloak / OIDC / SAML, ELK/Wazuh, SAST/DAST ou autres outils de sécurité.
- Expérience dans les opérations bare metal (serveurs, stockage, virtualisation, mise en réseau).
Pourquoi vous aimerez travailler ici
- Impact : votre travail soutient directement les plateformes qui surveillent, optimisent et prévoient la production d'énergie propre dans le monde entier.
- Environnement : stabilité d'une entreprise cotée en bourse (NASDAQ : TYGO) avec une petite équipe, un mode de fonctionnement et une structure de propriété de type start-up.
- Stack : outils modernes (Kubernetes, Talos, Terraform, GitOps, OTEL, Kafka, ClickHouse, Redis) avec possibilité de définir l'orientation.