Oportunidade para SRE / Site Reliability Engineer (Java & Cloud) Estamos em busca de um(a) profissional com forte atuação em SRE, Observabilidade e Engenharia de Plataforma , que tenha experiência em ambientes críticos, microsserviços, cloud e automação. Stack principal: Dynatrace Grafana ELK / Kibana CloudWatch OpenTelemetry Kubernetes AWS & Azure Java 17 Principais responsabilidades: Atuar na análise, desenvolvimento e evolução de sistemas críticos; Implementar e evoluir práticas de observabilidade, monitoramento e confiabilidade; Desenvolver automações e mecanismos de self-healing; Conduzir post-mortems e implementar ações preventivas; Realizar análises preditivas de performance, testes de estresse e Chaos Engineering; Trabalhar com métricas, logs e traces distribuídos utilizando OpenTelemetry; Apoiar iniciativas de FinOps para otimização de custos em cloud. Requisitos: Experiência com Java 17 e arquitetura de microsserviços; Spring Boot, Quarkus e Apache Camel; APIs REST e SOAP; Kubernetes, Docker, OpenShift e Helm; CI/CD com Jenkins, GitLab CI ou AWS CodePipeline; Banco de dados SQL e NoSQL; Kafka, RabbitMQ ou ActiveMQ; Terraform ou CloudFormation; Observabilidade com Dynatrace, Grafana, Kibana, Prometheus e CloudWatch; OpenTelemetry, tracing distribuído e monitoramento de aplicações; Conhecimento em AWS e Azure; Vivência com práticas SRE, resiliência, troubleshooting de performance e Chaos Engineering. Procuramos profissionais que gostem de atuar na interseção entre desenvolvimento, operações e confiabilidade, contribuindo para a estabilidade, escalabilidade e evolução contínua das plataformas.