PRINCIPAIS RESPONSABILIDADES: Monitorar proativamente a infraestrutura de rede, servidores, aplicações e serviços utilizando ferramentas de monitoramento e observabilidade.
Identificar e diagnosticar incidentes e problemas, acionando as equipes responsáveis conforme os procedimentos estabelecidos.
Realizar o primeiro nível de troubleshooting para resolver problemas comuns e restaurar serviços rapidamente.
Documentar incidentes, suas causas e as ações corretivas tomadas, mantendo registros precisos no sistema de gestão de tickets.
Escalar problemas complexos para equipes de nível superior (Nível 2/3) e acompanhar a resolução.
Participar da criação e atualização de playbooks, procedimentos operacionais padrão (SOPs) e bases de conhecimento.
Contribuir para a melhoria contínua dos processos de monitoramento e resposta a incidentes.
Gerar relatórios periódicos sobre o desempenho da infraestrutura e a ocorrência de incidentes.
CONHECIMENTO TÉCNIC
O:Conhecimento em redes (roteamento, switching, firewalls), sistemas operacionais (Linux, Windows Server) e virtualização (VMware, Hyper-V
).Experiência prática com ferramentas de monitoramento e observabilidade, incluindo: Zabbix, Prometheus, Grafana, ELK Stack, Wazu
h;Habilidade para realizar troubleshooting e identificar a causa raiz de problemas complexo
s.Experiência com dashboards e alertas de monitorament
o.Conhecimento em automação de tarefas (scripts em Bash, Python ou PowerShell) considerado diferencia
l.Certificações na área de redes ou sistemas serão consideradas um diferencia
Noc (Network Operations Center)
GRUPO LUME
São José dos Pinhais, Paraná