Infomaniak, das sind 30 Jahre Erfahrung und über 290 engagierte Mitarbeiter:innen mit einem gemeinsamen Ziel: eine ethische Cloud zu schaffen, die keine Kompromisse in Bezug auf Ökologie, Privatsphäre und Nachhaltigkeit eingeht. Wir schaffen Zentren, die an der Spitze der ökologischen Innovation stehen, und entwickeln vollständig in der Schweiz gehostete und entwickelte IaaS-, PaaS- und SaaS-Dienste für B2B- und B2C-Anwendungen. Unsere Lösungen umfassen eine Online-Suite sowie Cloud-Hosting-, Streaming-, Marketing- und Eventlösungen. Mit Millionen von zufriedenen Kunden und Vertrauen von öffentlichen und privaten Institutionen in ganz Europa — wie der RTBF, den Vereinten Nationen, Zentralbanken, über 200 Radios und Fernsehsendern sowie vielen Metropolen und Sicherheitsbehörden — ist Infomaniak ein unabhängiges Unternehmen, das sich für technologische Unabhängigkeit in Europa, die lokale Wirtschaft und eine nachhaltigere digitale Zukunft für den Planeten einsetzt. Bist du bereit, Teil eines wachsenden Unternehmens zu werden, dein Bestes zu geben und mit uns zu wachsen, um zur Entwicklung ethischer Alternativen zu den Giganten des Webs beizutragen? Dann freuen wir uns darauf, dich kennenzulernen! Wir suchen eine:n: AI DevOps / Infrastruktur: Infomaniak entwickelt eine Open-Source-KI, die auf eigenen Servern in der Schweiz gehostet wird. Wir setzen großangelegte Sprachmodelle ein und bauen intelligente Agenten für unsere Produkte (kMeet, kDrive). Wir suchen eine:n AI Engineer, um unsere KI-Agenten zu entwerfen, zu implementieren und zu optimieren, mit einem Fokus auf Qualität, Zuverlässigkeit und Benutzererfahrung.Verantwortlichkeiten:- Bereitstellung & Optimierung: Deployment, Wartung und Optimierung von LLMs X unter Maximierung der Effizienz der GPU-Ressourcen. - Verbesserung und Industrialisierung unserer GitLab CI-Pipelines für KI-Modelle (Build, Test, Deployment, Rollback). - Steuern der Bereitstellungen über Flux CD (GitOps). Überwachung & Sichtbarkeit: Stärkung unseres Stacks mit Prometheus / Grafana / Victoria Metrics für eine detaillierte Sicht auf Leistung, GPU-Auslastung, Verfügbarkeit und allgemein die Gesundheit der Dienstleistungen.Ressourceneffizienz: Arbeiten an Kosten- und Leistungsoptimierung (Autoscaling, Scheduling, Quotenmanagement, etc.).Zuverlässigkeit: Gewährleistung der Robustheit, Sicherheit und Reproduzierbarkeit der Bereitstellungen in einer kritischen Umgebung.Das Profil, das uns anspricht:- Beherrschung moderner Server-Frameworks (z.B. vLLM, TGI).- Beherrschung von GitLab CI (Pipelines, Runner, Variablen) in Kubernetes.- Nachweisliche Erfahrung mit Kubernetes, Helm, CRDs, Networking, Autoscaling.- Erfahrung mit Flux CD (GitOps, HelmReleases, Kustomize, Deployments).- Erfahrung mit Prometheus / Grafana (Dashboards, Alarmierung, Exporter).- Kenntnisse in GPU-Infrastrukturen (NVIDIA, CUDA, GPU-Scheduling, Monitoring).- Interesse an Qualität, Zuverlässigkeit und Leistung.- Fähigkeit, in einer kritischen Umgebung (hohe SLA, hohe Verfügbarkeit) zu arbeiten.- Gute Fähigkeit zur Zusammenarbeit mit ML-Teams.Wenn du Kenntnisse in hast:Technische Neugier, Freude an innovativen Herausforderungen und Beiträge zu Open Source oder Nebenprojekten sind willkommen. Du arbeitest gerne im Team und zeigst eine positive Einstellung. Dein Humor, deine Flexibilität und dein Teamgeist sind unerlässlich für die Arbeit im Spaß.Der technische Stack, den wir verwenden:- LangChain- Pydantic-aivLLM- FastAPI- GitLab- Sentry- Qdrant Der Job: UnbefristetArbeitszeit: 80 - 100% Standort: GenfVerfügbarkeit: So schnell wie möglich Die Schritte im Rekrutierungsprozess:Ein erstes technisches Interview zur Validierung deiner Fähigkeiten, gefolgt von einem zweiten Interview in unseren Büros. jidd356857ade jit0206ade jpiy26ade