Fais de ta passion un travail qui a du sens
Rejoindre Infomaniak, c’est intégrer un fleuron technologique où vous serez entouré·e des meilleurs talents pour créer des solutions cloud et de productivité éthiques et souveraines.
Infomaniak, c’est l’entreprise derrière SwissTransfer et un partenaire de confiance pour des organisations de premier plan : des institutions internationales comme les Nations Unies, des médias tels que France Télévisions, des événements iconiques comme le Montreux Jazz Festival et le Festival d’Annecy, ainsi que des banques centrales, de grandes métropoles et des organismes de sécurité à travers l’Europe.
Entreprise indépendante, certifiée B Corp et primée pour ses data centers qui repoussent les limites de l’efficacité et de la revalorisation énergétique, Infomaniak est la preuve vivante qu’il est possible de construire un numérique différent : souverain, durable et bénéfique pour l’économie locale. Ici, votre passion deviendra un travail qui a du sens : vous évoluerez avec autonomie, porterez de vraies responsabilités et contribuerez à des projets qui touchent des millions de personnes.
Contexte
Infomaniak développe une plateforme IA open source hébergée sur ses propres datacenters suisses. Nous déployons des modèles de langage à grande échelle et construisons des agents intelligents pour nos produits (kChat, kMeet, kDrive). Nous recherchons un·e AI Engineer pour concevoir, implémenter et optimiser nos agents IA, avec un focus sur la qualité, la fiabilité et l’expérience utilisateur.
Tes responsabilités
* Déploiement & Orchestration : Déployer, maintenir et optimiser des LLM sur Kubernetes en maximisant l’efficacité des ressources GPU / Compute.
* CI/CD & Automatisation : Améliorer et industrialiser nos pipelines Gitlab CI pour les modèles IA (build, test, déploiement, rollback). Piloter les déploiements via Flux CD (GitOps).
* Monitoring & Observabilité : Renforcer notre stack Prometheus / Grafana / Victoria Metrics pour une visibilité fine sur les performances, la consommation GPU, la latence, la disponibilité et la santé des services IA.
* Optimisation des ressources : Travailler sur l’efficacité des coûts et des performances (autoscaling, scheduling, gestion des quotas, optimisation des images…)
* Qualité & Fiabilité : Garantir la robustesse, la sécurité et la reproductibilité des déploiements dans un environnement critique.
Le profil qui nous fait vibrer
* Maîtrise des frameworks modernes de serving (ex : vLLM, TGI, TensorRT-LLM…)
* Maîtrise de GitLab CI (pipelines, runners, variables, intégration avec Kubernetes).
* Expérience confirmée en Kubernetes (operators, Helm, CRDs, networking, autoscaling).
* Expérience avec Flux CD (GitOps, HelmReleases, Kustomize, automatisation des déploiements).
* Expérience avec Prometheus / Grafana (dashboards, alerting, exporters).
* Connaissance des infrastructures GPU (NVIDIA, CUDA, GPU scheduling, monitoring).
* Appétence pour la qualité, la fiabilité et la performance.
* Capacité à travailler en environnement critique (SLA élevé, haute disponibilité).
* Bonne capacité à collaborer avec des équipes ML et Dev.
Connaissances supplémentaires appréciées
* Curiosité technique, goût pour les challenges innovants et l’optimisation.
* Contributions open source ou side projects appréciés.
* Communication positive et esprit d’équipe.
* Sens de l’humour, flexibilité et dynamique de travail en équipe.
La stack technique utilisée
* LangChain
* Pydantic-ai
* vLLM
* FastAPI
* Gitlab
* Sentry
* Qdrant
Le poste
* Contrat à durée indéterminée
* Taux d’occupation : 80 - 100%
* Localisation : Genève
* Disponibilité : Au plus vite
Chez Infomaniak, nous nous engageons en faveur de la diversité, de l’équité et de l’inclusion des collaborateurs·trices sur le lieu de travail. Nos offres d’emploi sont ouvertes à tous·tes et tous les dossiers de candidatures sont évalués sur un pied d’égalité, qu’importe le genre, l’origine, la religion, l’orientation sexuelle ou le handicap des candidat·e·s.
#J-18808-Ljbffr