Talent.com
Senior Systems Engineer (AI Cloud Infrastructure)
Senior Systems Engineer (AI Cloud Infrastructure)MULTIVERSE COMPUTING • München, Bayern, Germany
Senior Systems Engineer (AI Cloud Infrastructure)

Senior Systems Engineer (AI Cloud Infrastructure)

MULTIVERSE COMPUTING • München, Bayern, Germany
Vor 8 Tagen
Stellenbeschreibung

Multiverse Computing

Multiverse is a well-funded, fast-growing deep-tech company founded in 2019. We are the largest quantum software company in the EU and have been recognized by CB Insights (2023 and 2025) as one of the 100 most promising AI companies in the world.

With 180+ employees and growing, our team is fully multicultural and international. We deliver hyper-efficient software for companies seeking a competitive edge through quantum computing and artificial intelligence.

Our flagship products, CompactifAI and Singularity, address critical needs across various industries :

CompactifAI is a groundbreaking compression tool for foundational AI models based on Tensor Networks. It enables the compression of large AI systems—such as language models—to make them significantly more efficient and portable.

Singularity is a quantum- and quantum-inspired optimization platform used by blue-chip companies to solve complex problems in finance, energy, manufacturing, and beyond. It integrates seamlessly with existing systems and delivers immediate performance gains on classical and quantum hardware.

You’ll be working alongside world-leading experts to develop solutions that tackle real-world challenges. We’re looking for passionate individuals eager to grow in an ethics-driven environment that values sustainability and diversity.

We’re committed to building a truly inclusive culture—come and join us.

Role description

We are looking for a Senior Engineer to lead a critical initiative within our Platform Engineering team : building the software layer for  AI Gigafactory . In this role, you will move beyond consuming public cloud resources to architecting and building a private "Neo-cloud" from the ground up. You will design the control planes that manage high-performance compute clusters, orchestrate thousands of GPUs, and optimize the hardware-software interface for massive AI workloads.

This role sits at the intersection of  High-Performance Computing (HPC), Kubernetes Internals, and Bare Metal Engineering.

What you will be doing

Building the Control Plane :  Designing and developing the software layer (APIs, Controllers, Agents) that automates the lifecycle of bare-metal AI infrastructure.

Orchestrating High-Scale Compute :  Architecting scheduling solutions for large-scale distributed training jobs across massive clusters of GPUs (NVIDIA H200 / B200 / B300), ensuring efficient bin-packing and gang scheduling.

Optimizing the Fabric :  Tuning the software-defined networking layer to support low-latency interconnects (InfiniBand / RDMA / RoCEv2) essential for multi-node training.

Developing Kubernetes Extensions :  Writing custom Kubernetes Operators and CRDs to abstract complex hardware realities (topology awareness, GPU partitioning) into usable interfaces for our Data Scientists.

Hardware-Level Debugging :  Investigating and resolving deep systems issues, ranging from PCIe bus errors and NCCL communication timeouts to kernel panics on bare-metal nodes.

Defining Standards :  Creating the "Golden Image" for AI workloads, managing drivers, firmware, and OS optimizations to squeeze maximum performance out of the hardware.

Requirements

Systems Programming Expertise :  10+ years of software engineering experience with strong proficiency in  Go (Golang) , C++, or Rust . You must be comfortable building system agents, APIs, and CLI tools.

Deep Kubernetes Knowledge :  You understand K8s internals beyond simple deployment. Experience with Custom Resource Definitions (CRDs), Operators, and the Kubernetes API server architecture.

GPU Ecosystem Experience :  Hands-on experience managing NVIDIA GPU clusters. Familiarity with NVIDIA drivers, CUDA toolkit, and the container runtime (NVIDIA Container Toolkit).

Linux Internals :  Deep understanding of the Linux kernel, cgroups, namespaces, and system performance tuning.

Infrastructure as Code :  Mastery of declarative infrastructure tools (Terraform, Ansible) but with a focus on provisioning physical hardware rather than just cloud VMs.

Problem Solving :  A proven track record of debugging complex distributed systems where the root cause could be code, network, or silicon.

Preferred qualifications

HPC Background :  Experience working with traditional supercomputing schedulers (Slurm, PBS) or modern batch schedulers (Volcano, Kueue, Ray).

Bare Metal Provisioning :  Experience with tools like Cluster API (CAPI), Metal3, Tinkerbell, Canonical MaaS, or OpenStack Ironic.

High-Speed Networking :  Knowledge of RDMA, InfiniBand, GPUDirect, and how to expose these technologies to containerized workloads.

AI / ML Familiarity :  Understanding of how distributed training works (e.g., PyTorch Distributed, Megatron-LM, DeepSpeed) and the infrastructure requirements of Large Language Models (LLMs).

Observability :  Experience building monitoring for hardware health (DCGM) and distributed tracing for long-running jobs.

Location : Applicants must have legal authorization to work in the country where the position is based

Perks & Benefits

Indefinite contract.

Equal pay guaranteed.

Variable performance bonus.

Signing bonus.

Relocation package (if applicable).

Private health insurance.

Eligibility for educational budget according to internal policy.

Hybrid opportunity.

Flexible working hours.

A high-performance, collaborative environment, operating at pace on cutting-edge technologies.

Career plan. Opportunity to learn and teach.

As an equal opportunity employer, Multiverse Computing is committed to building an inclusive workplace. The company welcomes people from all different backgrounds, including age, citizenship, ethnic and racial origins, gender identities, individuals with disabilities, marital status, religions and ideologies, and sexual orientations to apply.

Jobalert für diese Suche erstellen

Senior Cloud Engineer • München, Bayern, Germany

Ähnliche Stellen
Senior System Engineer Backup (m / w / d)

Senior System Engineer Backup (m / w / d)

BWI GmbH • Bonn, München, Strausberg, Wilhelmshaven, bundesweit
Kolleg •innen betreiben und modernisieren wir eine der größten und komplexesten IT-Infrastrukturen in Deutschland.Sorge gemeinsam mit uns für die digitale Zukunftsfähigkeit unseres Landes.Senior Sys...Mehr anzeigen
Zuletzt aktualisiert: vor 8 Tagen • Gesponsert
Tech Lead - Cloud, Innovation & AI (m / w / d)

Tech Lead - Cloud, Innovation & AI (m / w / d)

Hays – Working for your tomorrow • München, Rosenheim
Der Bereich IT ist unsere Kernkompetenz, auf deren Grundlage sich Hays entwickelt hat.Wir beherrschen die komplette IT-Klaviatur von Support bis zur Softwarearchitektur oder Digitalisierung - dank ...Mehr anzeigen
Zuletzt aktualisiert: vor 1 Tag • Gesponsert
Senior Azure & Databricks Engineer (m / w / d) - Mnchen

Senior Azure & Databricks Engineer (m / w / d) - Mnchen

INFOMOTION GmbH • Freising, Germany
Mindestens fnf Jahre Erfahrung im Cloud Data Engineering mit Microsoft Azure & Databricks.Tiefes Know-how in Datenintegration, Datenarchitekturen und Cloud Data Management.Projekt- oder Teilprojekt...Mehr anzeigen
Zuletzt aktualisiert: vor über 30 Tagen • Gesponsert
(Senior) Software Engineer (f / m / x)

(Senior) Software Engineer (f / m / x)

Tanso Technologies GmbH • Bad Tölz, Germany
Previous experience working in a startup environment.Experience with PostgreSQL, Redis, and Microsoft Azure.Consistent problem-solver with strong end-to-end ownership and a product-focused mindset....Mehr anzeigen
Zuletzt aktualisiert: vor 4 Tagen • Gesponsert
(Senior) System Engineer MS Cloud (m / w / d)

(Senior) System Engineer MS Cloud (m / w / d)

netgo group GmbH • München, DE
Werde auch du "part of netgo group" - einem der größten IT-Dienstleister Deutschlands.Mitarbeiter •innen an zahlreichen Standorten in ganz Deutschland erwarten dich als neues Teammitglied.Senior) Sy...Mehr anzeigen
Zuletzt aktualisiert: vor über 30 Tagen • Gesponsert
Duales Studium Wirtschaftsinformatik Fachrichtung Software Engineering

Duales Studium Wirtschaftsinformatik Fachrichtung Software Engineering

Atruvia AG • Aschheim bei München
Dabei nutzen wir zukunftsweisende Technologien wie Smart Data und schreiben Prozessoptimierung und Regulatorik groß.Starte deine Karriere bei Atruvia : . Das Duale Studium vermittelt Theorie und biete...Mehr anzeigen
Zuletzt aktualisiert: vor 5 Tagen • Gesponsert
Lead Cloud Google Engineer (m / w / d) / Google Cloud Platform und AWS -Mnchen

Lead Cloud Google Engineer (m / w / d) / Google Cloud Platform und AWS -Mnchen

INFOMOTION GmbH • Munich, Bayern, Germany
Erfahrung : 24 Jahre in Data Engineering mit Schwerpunkt Google Cloud Platform, gerne auch AWS-Kenntnisse.Know-how : Best Practices in Aufbau, Evaluierung und Umsetzung von GCP-Architekturen.Methoden...Mehr anzeigen
Zuletzt aktualisiert: vor 29 Tagen • Gesponsert
Senior Systems Engineer (m / w / d)

Senior Systems Engineer (m / w / d)

BWI GmbH • München, DE
Sorge gemeinsam mit uns für die digitale Zukunftsfähigkeit der Bundeswehr.Kolleg •innen betreiben und modernisieren wir eine der größten und komplexesten IT-Infrastrukturen in Deutschland.Die Abteil...Mehr anzeigen
Zuletzt aktualisiert: vor 4 Tagen • Gesponsert
Microsoft 365 System Engineer (m / w / d)

Microsoft 365 System Engineer (m / w / d)

Vierthaler IT GmbH • Eching
Bist Du genervt von komplexen Prozessen, die unnötig deine wertvolle Zeit stehlen?.Möchtest Du mit modernen, cloudbasierten Technologien eigenverantwortlich arbeiten können?.Wenn Du klare Anforderu...Mehr anzeigen
Zuletzt aktualisiert: vor 8 Stunden • Gesponsert • Neu!
IT Systems Specialist (m / w / d)

IT Systems Specialist (m / w / d)

Esri Deutschland GmbH • Kranzberg bei München
Du willst dabei unterstützen, die Welt besser zu verstehen? Und dazu beitragen, die Zukunft nachhaltig zu gestalten? Dann bist Du bei Esri genau richtig. Mit der weltweit modernsten GIS-Technologie ...Mehr anzeigen
Zuletzt aktualisiert: vor 1 Tag • Gesponsert
Systemadministratorin (m / w / d) Administration und Weiterentwicklung von Enterprise Wiki-Lösungen

Systemadministratorin (m / w / d) Administration und Weiterentwicklung von Enterprise Wiki-Lösungen

Leibniz-Rechenzentrum (LRZ) der Bayerischen Akademie der Wissenschaften • Garching bei München
Geht es um die Digitalisierung der Wissenschaft sind wir traditionell voraus.Mehr anzeigen
Zuletzt aktualisiert: vor 11 Tagen • Gesponsert
System Engineer (m / w / d)

System Engineer (m / w / d)

Zeppelin GmbH • Garching bei München
Mitarbeitende arbeiten in den Bereichen Bauwirtschaft und Industrie.Und das in 29 Ländern dieser Welt! Als Stiftungsunternehmen lebt der Konzern Werte, die auf Luftfahrtpionier und Visionär Ferdina...Mehr anzeigen
Zuletzt aktualisiert: vor 8 Stunden • Gesponsert • Neu!
Senior Azure Cloud Architect

Senior Azure Cloud Architect

Nordcloud, an IBM company • Freising, Germany
Hands-on experience with Azure from successfully implemented projects.Experience with leading a technical team - providing guidance to your colleagues in the project. DevSecOps or SRE 'toolkit' and ...Mehr anzeigen
Zuletzt aktualisiert: vor über 30 Tagen • Gesponsert
Senior Cloud Engineer Azure (m / w / d)

Senior Cloud Engineer Azure (m / w / d)

Hyand Group • Munich, Bavaria, Germany
Senior Cloud Engineer Azure (m / w / d) Standorte Braunschweig Ratingen Berlin Hamburg Frankfurt am Main Dortmund Köln München Unternehmen Hyand Solutions Arbeitsmodell vor Ort Hybrid Über Hyand ...Mehr anzeigen
Zuletzt aktualisiert: vor 1 Tag • Gesponsert
Platform Engineer (DevOps Engineer / Cloud Engineer / Site Reliability Engineer) (m / w / d)

Platform Engineer (DevOps Engineer / Cloud Engineer / Site Reliability Engineer) (m / w / d)

CIB software GmbH • München und bundesweit, Homeoffice möglich, DE
Homeoffice
Rolle in unseren internen und externen Prozessen.Zu deinen Hauptaufgaben gehören die Entwicklung und Verwaltung unserer Plattformen, die Automatisierung von Prozessen und die Zusammenarbeit mit den...Mehr anzeigen
Zuletzt aktualisiert: vor 3 Tagen • Gesponsert
Senior Cloud Engineer – Microsoft Backend (m / w / d)

Senior Cloud Engineer – Microsoft Backend (m / w / d)

CANCOM SE • Aachen, Frankfurt am Main, Köln, Košice, München
Bei CANCOM erwartet dich ein innovatives, agiles und nachhaltiges Umfeld : Mehr als 5.Mitarbeiter arbeiten tagtäglich daran, mit Hilfe moderner IT-Lösungen die Zusammenarbeit und den Austausch in ve...Mehr anzeigen
Zuletzt aktualisiert: vor über 30 Tagen • Gesponsert
Solution Architect (m / w / d)

Solution Architect (m / w / d)

Esri Deutschland GmbH • Kranzberg
Du willst dabei unterstützen, die Welt besser zu verstehen? Und dazu beitragen, die Zukunft nachhaltig zu gestalten? Dann bist Du bei Esri genau richtig. Mit der weltweit modernsten GIS-Technologie ...Mehr anzeigen
Zuletzt aktualisiert: vor 8 Tagen • Gesponsert
Senior Systems Engineer (AI Cloud Infrastructure)

Senior Systems Engineer (AI Cloud Infrastructure)

MULTIVERSE COMPUTING • München, Bayern, DE
Quick Apply
Come and join our multicultural team!.Multiverse is a well-funded, fast-growing deep-tech company founded in 2019.We are the largest quantum software company in the EU and have been recognized by C...Mehr anzeigen
Zuletzt aktualisiert: vor 22 Tagen