Job Informationen Arbeitsort: Rotkreuz vor Ort, mit zusätzlicher Option auf Homeoffice Pensum: 60-100% Aufgaben: - Integration und Fine-Tuning von Open-Weight- und kommerziellen LLMs (GPT OSS, Mistral, Cohere, OpenAI) - Entwicklung und Optimierung multimodaler Verarbeitungspipelines (Text, Audio, Bild) inkl. OCR, Docling und Whisper - Design und Verbesserung von RAG-Pipelines mit Fokus auf Recall, semantische Relevanz und Robustheit - Implementierung von Query-Focused Summarization (QFS) für präzise, kontextgerechte Informationsaufbereitung - Optimierung von Chunking-, Embedding- und Indexierungsstrategien für skalierbares Retrieval - Definition und Auswertung von Metriken zu Relevanz, Halluzinationskontrolle und Modellzuverlässigkeit - Aufbau von Human-in-the-Loop Prozessen für Qualitätskontrolle - Sicherstellung von Model Governance, Zugriffsmanagement und sicherem Umgang mit Daten - Dokumentation von Modellarchitekturen, Benchmarks und Deployment-Prozessen - Aktives Verfolgen aktueller Entwicklungen in Open-Source-LLMs und verantwortungsvoller KI Dein Profil: - Nachweisbare Erfahrung im produktiven Einsatz von LLMs - Tiefes Verständnis von Frameworks wie PyTorch, Transformers und LangChain - Erfahrung im Fine-Tuning von Open-Weight Modellen (GPT OSS, Mistral, Cohere) - Gute Kenntnisse von Datenpipelines, Vector-Datenbanken und RAG-Architekturen - Vertraut mit multimodaler Verarbeitung (Text, Audio, Bild) sowie ETL-Pipelines für unstrukturierte Daten - Erfahrung mit MLflow, Kubeflow oder Weights & Biases - Sehr gute Python-Kenntnisse sowie Erfahrung mit Pandas, NumPy und PyTorchLightning - Analytische und strukturierte Arbeitsweise, sowie Interesse an verantwortungsvoller und transparenter KI Benötigte Skills * ETL * Python * Machine Learning