Oportunidade para SRE / Site Reliability Engineer (Java & Cloud) 🚀
Estamos em busca de um(a) profissional com forte atuação em SRE, Observabilidade e Engenharia de Plataforma, que tenha experiência em ambientes críticos, microsserviços, cloud e automação.
🔎 Stack principal:
✅ Dynatrace
✅ Grafana
✅ ELK / Kibana
✅ CloudWatch
✅ OpenTelemetry
✅ Kubernetes
✅ AWS & Azure
✅ Java 17
Principais responsabilidades:
✔ Atuar na análise, desenvolvimento e evolução de sistemas críticos;
✔ Implementar e evoluir práticas de observabilidade, monitoramento e confiabilidade;
✔ Desenvolver automações e mecanismos de self-healing;
✔ Conduzir post-mortems e implementar ações preventivas;
✔ Realizar análises preditivas de performance, testes de estresse e Chaos Engineering;
✔ Trabalhar com métricas, logs e traces distribuídos utilizando OpenTelemetry;
✔ Apoiar iniciativas de FinOps para otimização de custos em cloud.
Requisitos:
🔹 Experiência com Java 17 e arquitetura de microsserviços;
🔹 Spring Boot, Quarkus e Apache Camel;
🔹 APIs REST e SOAP;
🔹 Kubernetes, Docker, OpenShift e Helm;
🔹 CI/CD com Jenkins, GitLab CI ou AWS CodePipeline;
🔹 Banco de dados SQL e NoSQL;
🔹 Kafka, RabbitMQou ActiveMQ;
🔹 Terraform ou CloudFormation;
🔹 Observabilidadecom Dynatrace, Grafana, Kibana, Prometheus e CloudWatch;
🔹 OpenTelemetry, tracing distribuído e monitoramento de aplicações;
🔹 Conhecimento emAWS e Azure;
🔹 Vivência com práticas SRE, resiliência, troubleshooting de performance e Chaos Engineering.
💡 Procuramos profissionais que gostem de atuar na interseção entre desenvolvimento, operações e confiabilidade, contribuindo para a estabilidade, escalabilidade e evolução contínua das plataformas.