Oportunidade para SRE / Site Reliability Engineer (Java & Cloud)
Estamos em busca de um(a) profissional com forte atuação em SRE, Observabilidade e Engenharia de Plataforma, que tenha experiência em ambientes críticos, microsserviços, cloud e automação.
Stack principal:
Dynatrace
Grafana
ELK / Kibana
CloudWatch
OpenTelemetry
Kubernetes
AWS & Azure
Java 17
Principais responsabilidades:
Atuar na análise, desenvolvimento e evolução de sistemas críticos;
Implementar e evoluir práticas de observabilidade, monitoramento e confiabilidade;
Desenvolver automações e mecanismos de self-healing;
Conduzir post-mortems e implementar ações preventivas;
Realizar análises preditivas de performance, testes de estresse e Chaos Engineering;
Trabalhar com métricas, logs e traces distribuídos utilizando OpenTelemetry;
Apoiar iniciativas de FinOps para otimização de custos em cloud.
Requisitos:
Experiência com Java 17 e arquitetura de microsserviços;
Spring Boot, Quarkus e Apache Camel;
APIs REST e SOAP;
Kubernetes, Docker, OpenShift e Helm;
CI/CD com Jenkins, GitLab CI ou AWS CodePipeline;
Banco de dados SQL e NoSQL;
Kafka, RabbitMQou ActiveMQ;
Terraform ou CloudFormation;
Observabilidadecom Dynatrace, Grafana, Kibana, Prometheus e CloudWatch;
OpenTelemetry, tracing distribuído e monitoramento de aplicações;
Conhecimento emAWS e Azure;
Vivência com práticas SRE, resiliência, troubleshooting de performance e Chaos Engineering.
Procuramos profissionais que gostem de atuar na interseção entre desenvolvimento, operações e confiabilidade, contribuindo para a estabilidade, escalabilidade e evolução contínua das plataformas.