PRINCIPAIS RESPONSABILIDADES: Monitorar proativamente a infraestrutura de rede, servidores, aplicações e serviços utilizando ferramentas de monitoramento e observabilidade. Identificar e diagnosticar incidentes e problemas, acionando as equipes responsáveis conforme os procedimentos estabelecidos. Realizar o primeiro nível de troubleshooting para resolver problemas comuns e restaurar serviços rapidamente. Documentar incidentes, suas causas e as ações corretivas tomadas, mantendo registros precisos no sistema de gestão de tickets. Escalar problemas complexos para equipes de nível superior (Nível 2/3) e acompanhar a resolução. Participar da criação e atualização de playbooks, procedimentos operacionais padrão (SOPs) e bases de conhecimento. Contribuir para a melhoria contínua dos processos de monitoramento e resposta a incidentes. Gerar relatórios periódicos sobre o desempenho da infraestrutura e a ocorrência de incidentes. CONHECIMENTO TÉCNIC O:Conhecimento em redes (roteamento, switching, firewalls), sistemas operacionais (Linux, Windows Server) e virtualização (VMware, Hyper-V ).Experiência prática com ferramentas de monitoramento e observabilidade, incluindo: Zabbix, Prometheus, Grafana, ELK Stack, Wazu h;Habilidade para realizar troubleshooting e identificar a causa raiz de problemas complexo s.Experiência com dashboards e alertas de monitorament o.Conhecimento em automação de tarefas (scripts em Bash, Python ou PowerShell) considerado diferencia l.Certificações na área de redes ou sistemas serão consideradas um diferencia

Noc (Network Operations Center)

GRUPO LUME

Vagas semelhantes

Vaga Afirmativa Para Pcd | Pessoa Assistente De Ti (Remoto)

TRILLIA

Médico De Família E Comunidade - Telemedicina - Ribeirão Preto E Região

BIO

Analista Financeiro Contador(A)

ADAFLOW

Esl Online Teacher

AMERILINGUA

Sr. Software Engineer Ii - Data Solutions & Measurement

CINT

Financial Operation

MEITUAN

Sap Consultant

THUNDERSOFT

Receba vagas semelhantes por e-mail