Tech Platform(Senior) Site Reliability Engineer (d/w/m)
Reliability ist dein zweiter Vorname?
Als Site Reliability Engineer (m / w / d) siehst du dich der faszinierenden Herausforderung gegenüber, SRE als neues Prinzip bei Paymenttools einzuführen.
Deine Aufgabe beinhaltet auch, die Produkt-Teams in Bezug auf ihr Reliability-Mindset zu entwickeln, kontinuierlich neue Systeme in das SRE-Modell einzubinden, mit den Infrastruktur-Teams bezüglich der benötigten Ressourcen zusammenzuarbeiten und an einer rotierenden Rufbereitschaft teilzunehmen.
Moderne Zahlungsmethoden sind etwas ganz Wunderbares. Apple Pay, PayPal, Kreditkarte - die Liste an Zahlungsmöglichkeiten ist lang.
Aber leider führt das bei Konsument : innen und im Handel zu Schmerz. Du kennst das.
Wir, Paymenttools, sind ein Start-up der REWE Group und möchten den Zahlungsverkehr in Europa aufräumen. Und später im ganzen Sonnensystem.
Anders ausgedrückt : #wesolvepayn.
Wir suchen erfahrene Site Reliability Engineers (m / w / d), die unser neu gegründetes SRE-Team verstärken und uns dabei helfen, dass unsere Zahlungssysteme und -tools zuverlässig, skalierbar, beobachtbar und sicher sind.
Als SRE wirst du mit Produktteams zusammenarbeiten, um Infrastruktur, Tools und Prozesse zu entwickeln, zu implementieren und zu warten, die unsere geschäftskritischen Zahlungsanwendungen und -dienste unterstützen.
Idealerweise verfügst du über einen fundierten Hintergrund im Bereich Software- und Infrastruktur-Engineering.
Deine Aufgaben :
- Du arbeitest mit Produktteams zusammen und berätst diese u.a. zu den Themen Reliability und Production Readiness für ihre Dienste.
- Du implementierst, automatisierst und verbesserst unsere Dienste, Infrastruktur, Tools, Aufgaben und Prozesse, um die Effizienz zu steigern und Fehler zu reduzieren.
- Du ermittelst, überwachst, misst und optimierst wichtige Metriken für unsere Systeme.
- Du nimmst an der Rufbereitschaft teil und behebst Vorfälle in unterschiedlichsten Services und auf allen Ebenen unseres Entwicklungs-Stacks.
- Du förderst eine Kultur des kontinuierlichen Lernens aus unseren Vorfällen und erarbeitest, wie man sie in Zukunft vermeiden kann.
- Es ist wichtig für dich, die Einhaltung der Sicherheits- und Regulierungsanforde-
rungen für unsere Zahlungssysteme zu gewährleisten.
Du treibst Projekte von End-to-End voran.
Deine Erfahrungen :
- Du hast mehrere Jahre relevante Erfahrung als Site Reliability Engineer, DevOps Engineer oder in einer vergleichbaren Funktion bei der Entwicklung, dem Aufbau und dem Betrieb großer Produktionssysteme.
- Du beherrschst mindestens eine Programmiersprache (z.B. Go, Java, Python).
- Du hast Erfahrung mit Cloud & Containers, wir benutzen GCP, Kubernetes.
- Du hast Erfahrung mit IaC, wir benutzen Terraform.
- Du kennst dich mit Observability aus und weißt, was du wie messen kannst (z. B. Prometheus, Grafana, Loki, Golden Signals, SLOs, Error Budgets).
- Du kommunizierst fließend und auf den Punkt in Englisch auf allen Ebenen der Organisation.
Unsere Benefits :
- Deutschland-Ticket, subventioniertes Abonnement
- 1.000 Euro jährliches Entwicklungs- und Weiterbildungsbudget + interne Schulungs Plattformen
- Rabatte auf Reisen, Mode, Technik und mehr durch unsere Corporate Benefits
- REWE Rabattkarte für Preisnachlässe bei Einzelhändlern der REWE-Gruppe
- JobRad, günstiges Fahrrad Leasing!
- Betriebliche Altersvorsorge
- Versicherungsdienstleistungen
Vorteile, wenn Du mit uns arbeitest :
- Wir sind hybrid
- Flexible Arbeitszeiten, die zu Deinem Arbeitsablauf passen, Deine Zeit ist wichtig!
- Verantwortung vom ersten Tag an
- Arbeite mit moderner und agiler Software wie Google Workspace, Slack, Asana, Jira, Lattice, Miro und Confluence
- Firmenevents wie Hackathons und Company Days (frag uns bei Interesse dazu!)