Arbeitsort: Rotkreuz vor Ort, mit zusätzlicher Option auf Homeoffice. Pensum: 60–100%.
Aufgaben
* Integration und Fine‑Tuning von Open‑Weight‑ und kommerziellen LLMs (GPT OSS, Mistral, Cohere, OpenAI)
* Entwicklung und Optimierung multimodaler Verarbeitungspipelines (Text, Audio, Bild) inkl. OCR, Docling und Whisper
* Design und Verbesserung von RAG‑Pipelines mit Fokus auf Recall, semantische Relevanz und Robustheit
* Implementierung von Query‑Focused Summarization (QFS) für präzise, kontextgerechte Informationsaufbereitung
* Optimierung von Chunking‑, Embedding‑ und Indexierungsstrategien für skalierbares Retrieval
* Definition und Auswertung von Metriken zu Relevanz, Halluzinationskontrolle und Modellzuverlässigkeit
* Aufbau von Human‑in‑the‑Loop Prozessen für Qualitätskontrolle
* Sicherstellung von Model Governance, Zugriffsmanagement und sicherem Umgang mit Daten
* Dokumentation von Modellarchitekturen, Benchmarks und Deployment‑Prozessen
* Aktives Verfolgen aktueller Entwicklungen in Open‑Source‑LLMs und verantwortungsvoller KIDein
Profil
* Nachweisbare Erfahrung im produktiven Einsatz von LLMs
* Tiefes Verständnis von Frameworks wie PyTorch, Transformers und LangChain
* Erfahrung im Fine‑Tuning von Open‑Weight Modellen (GPT OSS, Mistral, Cohere)
* Gute Kenntnisse von Datenpipelines, Vector‑Datenbanken und RAG‑Architekturen
* Vertraut mit multimodaler Verarbeitung (Text, Audio, Bild) sowie ETL‑Pipelines für unstrukturierte Daten
* Erfahrung mit MLflow, Kubeflow oder Weights & Biases
* Sehr gute Python‑Kenntnisse sowie Erfahrung mit Pandas, NumPy und PyTorchLightning
* Analytische und strukturierte Arbeitsweise, sowie Interesse an verantwortungsvoller und transparenter KI
Benötigte Skills
Pensum Voll-/Teilzeit
#J-18808-Ljbffr