SRE / DevOps EngineerSobre a FunçãoO Engenheiro de SRE/DevOps será dedicado à confiabilidade e infraestrutura, estabelecendo a base para a excelência de produção em toda a organização de engenharia.Você trabalhará em todas as equipes (CRM, Plataforma, IA, Mobile e Dados), detendo a responsabilidade pela infraestrutura de confiabilidade, observabilidade e implantação de uma plataforma de CRM multi-serviços rodando na AWS, reportando-se ao Gerente de Engenharia e colaborando com cada Tech Lead.O Que Você FaráDeter e evoluir a infraestrutura de pipelines de CI/CD, permitindo implantações rápidas, seguras e repetíveis em múltiplos serviços e ambientes.Construir e manter a Infraestrutura como Código (IaC) para todos os recursos da AWS, eliminando a configuração manual e garantindo a reprodutibilidade.Projetar e implementar sistemas abrangentes de monitoramento, alerta e observabilidade usando IA em combinação com ferramentas como New Relic, CloudWatch e painéis (dashboards) personalizados.Gerenciar e otimizar a infraestrutura AWS, incluindo EC2, RDS (MySQL 8.0), Lambda, CloudWatch e serviços relacionados.Estabelecer e acompanhar Objetivos de Nível de Serviço (SLOs) e Indicadores de Nível de Serviço (SLIs) para medir e melhorar a confiabilidade da plataforma.Liderar processos de resposta a incidentes, incluindo procedimentos de sobreaviso (on-call), runbooks, revisões pós-incidente e rastreamento de remediações.Otimizar o desempenho do banco de dados em escala, incluindo identificação de consultas lentas (slow queries), otimização de índices, gerenciamento de pool de conexões e saúde da replicação.Automatizar tarefas operacionais que atualmente são manuais, reduzindo o trabalho repetitivo (toil) e liberando as equipes de engenharia para focar no desenvolvimento de funcionalidades.Reforçar as práticas de segurança na infraestrutura, incluindo configuração de rede, gerenciamento de segredos, controles de acesso e conformidade com auditorias de segurança.Colaborar com as equipes de funcionalidades no planejamento de capacidade, testes de desempenho e decisões de arquitetura que impactam a confiabilidade.Construir ferramentas internas e documentação que permitam aos desenvolvedores o autoatendimento (self-serve) em necessidades comuns de infraestrutura.Participar de avaliações de segurança e remediação de testes de intrusão (pentests), garantindo que a infraestrutura atenda aos padrões de segurança.O Que Você Traz (Requisitos)Mais de 5 anos de experiência em funções de SRE, DevOps ou engenharia de infraestrutura.Forte proficiência com serviços AWS, particularmente EC2, RDS (MySQL), Lambda, CloudWatch, IAM, VPC e S3.Experiência prática com ferramentas de Infraestrutura como Código (Terraform, CloudFormation, Ansible ou equivalente).Experiência profunda com sistemas de CI/CD (Bitbucket Pipelines, Jenkins, GitHub Actions ou similares), incluindo construção e manutenção de pipelines de implantação para arquiteturas de múltiplos serviços.Fortes habilidades de administração de sistemas Linux e capacidade de escrita de scripts (Bash, Python).Sólida compreensão da administração de bancos de dados MySQL, incluindo replicação, backup/recuperação, ajuste de desempenho (tuning) e gerenciamento de conexões.Experiência com plataformas de monitoramento e observabilidade (New Relic, Datadog, Prometheus/Grafana ou similar).Familiaridade com tecnologias de conteinerização (Docker) e orquestração (Kubernetes ou ECS).Compreensão de fundamentos de rede (DNS, balanceamento de carga, VPN, regras de firewall, SSL/TLS).Fortes habilidades de gerenciamento de incidentes, incluindo experiência na definição de escalas de sobreaviso, redação de runbooks e condução de post-mortems isentos de culpa (blameless).Excelentes habilidades de comunicação e capacidade de trabalhar de forma colaborativa com várias equipes de engenharia.Experiência demonstrada no uso de ferramentas de desenvolvimento assistidas por IA nos fluxos diários de engenharia. Isso inclui ferramentas como Cursor, GitHub Copilot, Claude Code, Amazon CodeWhisperer ou assistentes de codificação de IA semelhantes para tarefas como escrever e revisar Infraestrutura como Código, gerar runbooks, automatizar a triagem de incidentes, analisar logs e estruturar configurações de monitoramento.Desejável (Diferenciais)Experiência com implantação e otimização de aplicações PHP (nossa plataforma principal é CakePHP).Experiência anterior em plataformas SaaS ou arquiteturas multi-tenant.Familiaridade com frameworks de conformidade de segurança (SOC 2, remediação de testes de intrusão).Experiência com otimização de custos para cargas de trabalho AWS.Conhecimento de implantação de aplicações Node.js e Python.Experiência com agregação e análise de logs (ELK Stack, CloudWatch Logs Insights).Histórico de migração de infraestrutura manual/legada para ambientes modernos gerenciados por IaC.Experiência de trabalho com equipes de engenharia distribuídas ou remotas.Valoriza-se muito a experiência no uso de ferramentas de IA para remediação de auditorias de segurança, análise de otimização de custos e documentação operacional.