Effektive KI-Modelle auf großem Maßstab bleiben ein Problem X. Wie plant man die Inferenzarbeitslasten auf heterogenen GPUs? Wie minimiert man, ohne den Durchsatz zu opfern? Wir stellen uns diesen und anderen verwandten Fragen im Rahmen eines Portfolios an angewandten Forschungsprojekten in Zusammenarbeit mit akademischen Partnern und suchen einen Forschungsingenieur, der eine Infrastruktur für die KI-Arbeitslasten entwirft und aufbaut, von Kubernetes und benutzerdefinierten Pipelines bis hin zu Inferenzsystemen und Überwachungssystemen. Die Projekte variieren in ihrem Umfang, aber ihr Wesen bleibt dasselbe: Produktionsreife Qualitätscode zu schreiben und diesen durch HEIG-VD-Daten zu verteidigen.HAUPTAUFGABEN:- Teilnahme an den Forschungs- und Entwicklungsprojekten des Instituts- Entwerfen und Implementieren von Scheduler und Controllern für K8s für die Inferenz- Integration und Erweiterung von Inferenz-Engines (vLLM, Ray)- Instrumentierung von Clustern und Ausführen reproduzierbarer Benchmarks zur Bewertung verschiedener Metriken: TTFT, Genauigkeit, Durchsatz, RAM/GPU- Untersuchung von Algorithmen und ressourcenschonender Platzierung auf heterogenen Systemen, Beitrag zur Erstellung wissenschaftlicher Artikel- Zusammenarbeit mit Industriepartnern während des gesamten Prozesses, von der TechnologieproblemuntersuchungGEWÜNSCHTES PROFIL:- Bachelor oder Master in Software Engineering oder einem verwandten Bereich- Nachweisliche Fähigkeiten in: C/C++, Go und/oder Python- Erfahrung mit Kubernetes und Linux, Containern- Kenntnisse im GPU-Computing (CUDA, Geräteverwaltung)- Technische Fähigkeiten in Englisch und Deutsch- Erfahrung mit Inferenz-Engines (vLLM, Ray, LiteLLM)- Kenntnisse in: Dekodierung, KV-Cache- Erfahrung mit Monitoring-Stacks und Hochleistungsnetzwerken- Open-Source-Beiträge und/oder EngagementAktivität: 80% bis 100%Informationen: Pamela Delgado, Dozentin HES, Tel: Wir laden Sie ein, uns Ihre vollständigen Unterlagen über JobUp bis zum 22. März zuzusenden. Vollständige Diskretion ist gewährleistet. Die Hochschule für Ingenieurwissenschaften und Management des Kantons Waadt ( ) bietet Bachelor- und Masterprogramme in Ingenieurwissenschaften sowie in Betriebswirtschaft und postgraduale Abschlüsse an. Mit über studierenden ist sie die größte Fachhochschule der Westschweiz ( ). jid2fe3399ade jit0311ade jpiy26ade