Cloudiax ist ein führender Anbieter von Cloud-Technologien mit mehr als 280 internationalen Partnern und über 1100 SAP-Kunden in 90 Ländern. Wir ermöglichen kleinen und mittelständischen Unternehmen weltweit die Nutzung von Anwendungen wie SAP Business One und KI-Lösungen in unserer Cloud. Als globaler Marktführer bieten wir eine sichere, schnelle und zuverlässige Cloud-Plattform – Made in Germany. Mit Rechenzentren in Deutschland, Kanada und Singapur stellen wir rund um die Uhr höchste Servicequalität sicher. Zur Verstärkung unseres Teams suchen wir dich – engagiert, technisch stark und bereit, Verantwortung zu übernehmen. Ab sofort und Remote. Aufgaben Cloud-Native & Infrastruktur Kubernetes : Tiefe Erfahrung in Cluster-Orchestrierung, GPU-Scheduling, Device-Plugins und Mandanten-Isolierung in Rechenzentren. Hardware-Abstraktion : Praktische Erfahrung mit Multi-Instance GPU (MIG) zur effizienten, sicheren Aufteilung physischer GPUs auf unterschiedliche Kunden-Workloads. Managed Backends : Sicherer Betrieb von Managed Postgres und Skalierung von Vektor-Datenbanken für performante Retrieval-Architekturen. Schnittstellen & Security : Kenntnisse in Keycloak, Kong API Gateway oder vergleichbaren Tools für sicheren Zugriff und exakte Abrechnung. DevOps & CI / CD : Erfahrung mit Git, CI / CD-Pipelines und Infrastructure-as-Code für schnelle, zuverlässige und dokumentierte Deployments. KI-Expertise & Inferenz-Logik Inferenz-Optimierung : Erfahrung mit KV-Caching, Batching, Quantisierung und Serving-Frameworks wie vLLM oder NVIDIA Triton. Modell-Kombination & Kostenmanagement : Wissen, wie kleine spezialisierte und große Generalisten-Modelle kombiniert werden, um Kosten und Latenz zu optimieren – Open und Closed Models. Qualitätssicherung : Techniken zur Reduzierung von Halluzinationen, z. B. Retrieval-Augmented Generation (RAG) und Bereitstellung valider Datenkontexte auf Infrastruktur-Ebene. Agenten & Frameworks : Operationalisierung von LangChain, LangGraph oder AutoGen sowie Management komplexer Deep Agents, die autonom mehrere Schritte ausführen. Monitoring & Skalierung (AI-Native) Observability : Tracing für Agenten-Entscheidungen (z. B. OpenTelemetry, LangSmith), um Abläufe im Rechenzentrum nachvollziehbar zu machen. KI-spezifisches Auto-Scaling : Skalierung basierend auf Token-Durchsatz oder Modell-Kontext-Auslastung, nicht nur CPU-Metriken. Qualifikation Du musst kein Prompt-Engineer sein, aber du verstehst, wie KI „arbeitet“. Wichtig ist, dass du neue Ansätze (z. B. Inferenzmethoden oder Agenten-Strukturen) schnell erfassen und in stabile, mandantenfähige Rechenzentrums-Infrastrukturen integrieren kannst. Experimentierfreude : Freude an Systemen, die nicht immer deterministisch reagieren. Security & Safety : Bewusstsein für AI-Security (Sandboxing, Schutz vor Prompt-Injections) bei jedem System. Benefits 100% Remote-Arbeitsplatz mit großer zeitlicher Flexibilität attraktives Jahresgehalt, sowie automatische KPI-basierte Gehaltserhöhungen und attraktive Jahresboni. 30+ Tage Erholungsurlaub. Voll ausgestatteter Premium-Homeoffice-Arbeitsplatz. Firmen-(e)Bike, betriebliche Kranken-Zusatzversicherung und weitere Corporate Benefits. Arbeiten in einem internationalen Umfeld bei einem der weltweit führenden Cloud-Provider im SAP-Umfeld. Haben wir dein Interesse geweckt? Dann lade hier gerne deine vollständigen Bewerbungsunterlagen hoch (Lebenslauf, Zeugnisse, Gehaltsvorstellung, frühestmöglicher Eintrittstermin).
DevOpsPlatform Expert AI Agentic Systems • Gudow, Germany