Oportunidade para SRE / Site Reliability Engineer (Java & Cloud)Estamos em busca de um(a) profissional com forte atuação em SRE, Observabilidade e Engenharia de Plataforma, que tenha experiência em ambientes críticos, microsserviços, cloud e automação.Stack principal:DynatraceGrafanaELK / KibanaCloudWatchOpenTelemetryKubernetesAWS & AzureJava 17Principais responsabilidades:Atuar na análise, desenvolvimento e evolução de sistemas críticos;Implementar e evoluir práticas de observabilidade, monitoramento e confiabilidade;Desenvolver automações e mecanismos de self-healing;Conduzir post-mortems e implementar ações preventivas;Realizar análises preditivas de performance, testes de estresse e Chaos Engineering;Trabalhar com métricas, logs e traces distribuídos utilizando OpenTelemetry;Apoiar iniciativas de FinOps para otimização de custos em cloud.Requisitos:Experiência com Java 17 e arquitetura de microsserviços;Spring Boot, Quarkus e Apache Camel;APIs REST e SOAP;Kubernetes, Docker, OpenShift e Helm;CI/CD com Jenkins, GitLab CI ou AWS CodePipeline;Banco de dados SQL e NoSQL;Kafka, RabbitMQ ou ActiveMQ;Terraform ou CloudFormation;Observabilidade com Dynatrace, Grafana, Kibana, Prometheus e CloudWatch;OpenTelemetry, tracing distribuído e monitoramento de aplicações;Conhecimento em AWS e Azure;Vivência com práticas SRE, resiliência, troubleshooting de performance e Chaos Engineering.Procuramos profissionais que gostem de atuar na interseção entre desenvolvimento, operações e confiabilidade, contribuindo para a estabilidade, escalabilidade e evolução contínua das plataformas.