You are on page 1of 66

Voc escolhe!

Negcio
Servios
Infraestrutura
Monitoramento da Rede

Mini Bio
Andr (Luis Boni) Do
Administrador de Redes no Gabinete do Reitor
Profissional Certificado Zabbix: Zabbix Cerified Specialist e Zabbix for Large Environments,
Fundador da Comunidade Zabbix Brasil, Palestrante na Zabbix Conference 2013, Membro da
Comisso Organizadora da Trilha Zabbix no Latinoware 2013.
Professor Universitrio (Instituio Privada), Apaixonado por Gerencia de Redes, Membro da
Comunidade OpenSource.

Por que utilizar um NMS?


Monitorar problemas de forma automatizada

Receber aviso de problema antes da ligao do usurio (ou do diretor!)

Servidores inativos so muito caros (Impactos Diretos e Indiretos)

Planejamento de investimentos em recursos de hardware

Avaliao de qualidade de servios

Um bom sistema de gerenciamento nos torna confiantes, nosso negcio est funcionando!

O que o Zabbix?
Um software Livre (e de cdigo fonte aberto True Open Source) com sistema de
monitoramento distribudo capaz de monitorar a disponibilidade e performance de
toda sua infra-estrutura de rede, alm de aplicaes;
Suporte a maioria dos sistemas operacionais: Linux, Solaris, HP-UX, AIX, FreeBSD,
OpenBSD, NetBSD, Mac OS, Windows, entre outros;
Monitora servios simples sem o uso de agentes:
icmpping Verifica se o host est acessivel atravs do ping;
http Verifica se a porta http (80) est respondendo;
pop Verifica se a porta pop3 (110) est respondendo;
ftp_perf Tempo de resposta (em ms) do servio de FTP;

Por que escolher o Zabbix?


Toda a lgica est do lado do servidor, os agentes so usados apenas para coleta de
dados
Extremamente flexvel! Triggers, Escalabilidade, Novas checagens, Telas e muito mais.
Projetado para lidar com as comunicaes instveis
Suporte total ao IPv6

Histria
Criado por Alexei Vladishev
Linha do tempo:
1998 : Escolhas disponveis HP OpenView, IBM, BMC: muito caros para comprar e manter
Que nome eu dou para este software?
ABCDEZabbix!
2001 : verso 1.0alpha1 em GPL
2004 : verso 1.0
2006 : verso 1.1

Histria
2007 : verso 1.4
2008 : verso 1.6
Zabbix 1.6.4, 500 downloads por dia, 15.000 usurios no frum

Histria
Trs livros sobre a ferramenta: Dois em Ingls e outro em Japons.

Histria
Trs livros sobre a ferramenta: Dois em Ingls e outro em Japons.

ZABBIX SIA Hoje


A Compania foi estabelecida h 7 anos, o time no para de crescer
Clientes com mais de 200.000 dispositivos monitorados
4 Premium Partners (Japo, Espanha, ustria, Brasil)
Mais de 50 Parceiros e Revendedores ao redor do mundo

ZABBIX SIA Hoje


Como a receita da empresa?

Suporte Comercial
Desenvolvimento Patrocinado
Implementaes
Consultoria
Treinamento
0% Licenas

Caractersticas
Verso atual: 2.2
Excelente Manual
Suporte do Frum
Suporte Comercial (ZABBIX SIA - sales@zabbix.com)
Suporte Comercial no Brasil pela Unirede: http://www.zabbix.com.br
Suporte Comercial no Brasil pela Alerta Security: www.alertasecurity.com.br

Caractersticas
Envio de alertas para: E-mail, Jabber, SMS e Scripts personalizados (Agenda do Google,
Gtalk, Acender Luzes, Painis de Led, etc)
Suporte nativo ao protocolo SNMP (Todas as verses)
Interface de gerenciamento Web, de fcil utilizao
Integrao com banco de dados (MySQL/MariaDB, Oracle, PostgreSQL, IBM DB2 ou SQLite)
Gerao de grficos em tempo real

Caractersticas
Fcil instalao e customizao
Agentes disponveis para diversas plataformas:
Linux, Solaris, HP-UX, AIX, FreeBSD, OpenBSD, SCO-OpenServer, Mac OS, Windows;
Agentes para plataformas 32 bits e 64 bits;
Integrao com os Contadores de Performance do Windows:
Windows 7: Mais de 15.000 itens !!
Windows Server 2008 R2 mais de 23.000 itens !!

Componentes

JAVA Proxy
ZABBIX Proxy
ZABBIX GUI

ZABBIX Server

ZABBIX DB

DATABASE Proxy

Como Monitorar
Verificaes de servio:
FTP, SSH, HTTP, SMTP, DNS ...
Agente Zabbix:
Checagem tiva e Passiva
JMX
Monitoramento de registros, logs de eventos
Fcil de personalizar
Execuo de comando remoto
Extremamente eficiente!
Outros:
Plugins WMI, Nagios

Como Monitorar
SNMP v1, v2, v3:
Dispositivos de rede
Normalmente NET-SNMP para servidores
Monitoramento de aplicaes (Oracle, Weblogic, Websphere, PostgreSQL, MySQL,
Active Directory, Bind, ...)
Traps SNMP
IPMI:
Monitoramento de hardware
Gerenciamento remoto (reboot, reset, desligamento)

Uso do Agente
Checagens Ativas:
Altamente eficiente
Buffer de dados coletados

Uso do Agente
Checagens Passivas:
Requer polling do lado do Servidor Zabbix
Desempenho adicional por causa dos pollings e da largura de banda de rede

Triggers... Hummmm....
CPU load is too high: {host:cpuload.last(0)}>5
A trigger ser verdadeira toda vez que a leitura mais recente da carga do
processador for maior que 5.
CPU load is too high: {host:cpuload.min(300)}>2 | {host:cpuuser.min(300)}>50
A trigger ser verdadeira se a carga do processador for maior que 2 nos ltimos
cinco minutos OU a carga do processador com processos de usurio for maior que
50 nos ltimos cinco minutos.
CPU load is too high: {host:cpuload.min(300)}>2 & {host2:backup.last(0)}=0
A trigger ser verdadeira se a carga do processador for maior que 2 nos ltimos
cinco minutos E a leitura mais recente do status do backup do host2 for 0. Pode
ser definido o que 0, 1, 2 ... N significam.

Dependncias
Elas so usadas para:
Evitar notificaes;
Definir dependncias entre diferentes problemas (relacionados a redes, aplicaes,
qualquer coisa). Inclusive sem dependncias de host!
Server est down => Switch1 est down => Switch2 est down
Servidor Web est down => MySQL no est respondendo => Sem espao livre no
/tmp

Escalabilidade
Reao para Falha de um Servidor Web:
Aumente a etapa a cada 5 minutos
Etapa 1-3: Enviar mensagem para os Unix Admins
Etapa 3-5: Enviar mensagem para Chefe, se no ACK
Passo 6: Reinicie o Apache, se no ACK
Passo 7: Reiniciar o servidor se no ACK
Passo 10: Enviar mensagem a todos os no ACK

Visualizao: Dashboard
Recursos Prediletos:
Mapas
Grficos
Telas
Exibio dos itens principais:
Problemas por grupos de hosts
Estatsticas do Zabbix
Lista dos ltimos alertas
Informaes do Web Monitoring
Auto Discovery

Visualizao: Dashboard

Visualizao: Grficos
Acesso Imediato:
Qualquer perodo de tempo
Navegao de linha do tempo fcil
Zoom a um clique do mouse
Problemas so visualizados
Marcao de tempo de down-time
Tipos de Grficos:
Standard (Pontos, Linhas, Cores)
Empilhado (Stacked)
Torta

Visualizao: Grficos

Visualizao: Telas
Diferentes Blocos:
Grficos
Mapas
Dados em texto plano
Lista de problemas
Lista dos ltimos alertas
Slide Show:
Conjunto de telas
Exibidas uma aps a outra

Visualizao: Telas

Monitoramento Web
Objetivos:
Acompanhamento da experincia do usurio
Suporte a cenrios complexos
Monitoramento de desempenho
Monitoramento de disponibilidade
Exemplo:
Passo 1 Acesso a home page
Passo 2 Login (POST, GET)
Passo3 Executar relatrio
Passo 4 - Logout

Monitoramento Web

Servios de TI
Objetivos:
Monitoramento de nvel de negcio
Monitoramento SLA
Escalonamento de problemas
Causa raz do problema
Estrutura de rvore baseada em:
Dependncias
Localizao Fsica
Tipo de servio, etc

Servios de TI

Gerenciamento de Usurios
Autenticao:
Standard: Banco de dados do Zabbix
LDAP (Active Directory/ OpenLDAP, etc)
Apache (Kerberos, Unix, etc)
Permisses:
Depende do tipo de usurio
Nvel de permisso por grupos
E ainda:
Notificaes apenas para grupos de usurios

Viso Gerencial

Viso Gerencial
Estratgico

Servios ao usurio
Metas de disponibilidade
Metas de desempenho
Sade do Ambiente

Ttico

Disponibilidade de aplicaes
Fluxos e integraes de dados
Redundncia / Balanceamento
Processos e Transaes

Operacional

Disponibilidade da rede
Disponibilidade de Servidores
Uso de CPU / Disco / Memria
Servios de SO

Viso Gerencial
Viso Operacional

Viso Ttica

Viso Estratgica

Viso Gerencial
Backbone
Operacional:
Rede
Equipamentos
Link
Ttico:
Redundncia dos Equipamentos
Redundncia dos Links
Estratgico:
Acesso recursos (CAPES, FAPESP, Processamento de Alto Desempenho, etc)
Acesso s bases de pesquisa (IEEE, ABNT, ISO, etc)
Disponibilidade de Artigos e Pesquisas

Viso Gerencial
Vestibular
Operacional:
Rede
Servidores
Ttico:
Pgina
Sistema Inscries
Sistema de Pagamentos
Estratgico:
Inscrio no Vestibular
Pagamento de Taxas
Pedidos de Isenes

Estendendo o Zabbix
Novas checagens no agente:
UserParameter=mysql.qps,mysqladmin uroot status|cut f9 d:
UserParameter=sum[*],echo $1+$2|bc
Exemplos: mysql.qps = 456, sum[4,5] = 9
Novo mtodo de notificao:
Apenas uma questo de escrever um Shell Script (gerao de voz, chamada Skype,
qualquer coisa)
Novas checagens no servidor:
Apenas uma questo de escrever um Shell Script

Estendendo o Zabbix
Uso de Itens Calculados:
Mailbox Exchange
last("service_state[\"IISADMIN\"]")+last("service_state[\"MSExchangeADTopology\"]")
+last("service_state[\"MSExchangeIS\"]")
+last("service_state[\"MSExchangeMailboxAssistants\"]")
+last("service_state[\"MSExchangeMailSubmission\"]")
+last("service_state[\"MSExchangeRepl\"]")
+last("service_state[\"MSExchangeRPC\"]")+last("service_state[\"MSExchangeSA\"]")
+last("service_state[\"MSExchangeSearch\"]")
+last("service_state[\"MSExchangeServiceHost\"]")
+last("service_state[\"MSExchangeThrottling\"]")
+last("service_state[\"MSExchangeTransportLogSearch\"]")
+last("service_state[\"W3Svc\"]")+last("service_state[\"WinRM\"]")
{Morpheus:service_state_Mailbox_Server_Role.last(0)}#0

Estendendo o Zabbix
Uso da API Zabbix (https://www.zabbix.com/documentation/2.0/api) + Ferramentas de
Gerao de Grficos (www.maani.us/xml_charts):

Estendendo o Zabbix
Zabbix Extras Adail Spinola
http://spinola.net.br/blog/
Zabbix-Cat => Relatrio de Anlise de capacidade.
Zabbix-SC => Relatrio de custo de armazenamento do histrico dos itens.
Zabbix-NS => Relatrio de itens no suportados.
Zabbix-IN => Correlacionador de eventos.

Estendendo o Zabbix
Geolocalizao em Zabbix Aristteles Arajo / Leandro Alves Machado

http://www.aristoteles.eti.br/zabbix/implementando-geolocalizacao-no-zabbix

Estendendo o Zabbix

Estendendo o Zabbix

Estendendo o Zabbix

Estendendo o Zabbix
Implementao de rvore de servios, utilizando HTML 5 2D SERPRO
https://github.com/rodrigofns

Estendendo o Zabbix
WeatherMap: Mapa do backbone com porcentagem de uso
https://wiki.minet.net/wiki/monitoring/weathermap

Zabbix 2.0
Design Atualizado
Melhor usabilidade do Zabbix Front-end
Reviso de todas os Forms e Pginas

Zabbix 2.0
Descoberta de baixo nvel (LLD Low Level Discovery)
Descoberta automtica de dispositivos de rede, sistemas de arquivos, processos, etc.
Descoberta de interfaces SNMP e contadores JMX
Um template para hosts com recursos diferentes!

Zabbix 2.0
Mltiplas interfaces de rede
Dispositivo monitorado suporta mltiplos Ips:
Um IP: monitoramento por SNMP
Noutro: Agente Zabbix
Noutro: Agente JMX
Noutro: Agente IPMI

Zabbix 2.0
Monitoramento remoto JMX
Suporte nativo de monitoramento JMX seguro
Descoberta de contadores JMX
Monitoramento de infra-estrutura Java: JBoss, WebLogic, Websphere,
Tomcat
Monitoramento de Aplicaes Java

Zabbix 2.0
Coleta automtica de dados de inventrio de hardware
Dados coletados automaticamente

Zabbix 2.0
Comandos remotos
Comandos remotos baseados em Telnet e SSH
Simplifica aes automticas em dispositivos de rede
Comandos remotos baseados em IPMI (shutdown remoto, reboots)
Para dispositivos que no possuem Agente Zabbix ou Agente SNMP

Zabbix 2.2
Monitoramento de VMs

Vms descobertas pelo LLD

http://andredeo.blogspot.com.br/2013/10/monitoramento-de-vms-com-zabbix-22.htm
l

O Futuro

Zabbix 2.X
Armazenamentos NoSQL
Zabbix Suporta: MySQL, PostgreSQL, Oracle, DB2, SQLite
Problema:
Mximo de 15.000 valores por segundo
No possvel escalar!
O desempenho cai significativamente quando o tamanho de dados histricos
aumentam

Zabbix 2.X
Soluo:
Uso de amazenamento NoSQL para dados histricos (Cassandra, Hadoop, HBase,
Hypertable, MongoDB, CouchDB, Neo4J). Terabytes de dados.
Teoricamente, o desempenho pode ser superior a 100.000 valores por segundo
Pode ser escalado horizontalmente. Mais servidores mais performance!
API para os dados histricos, voc poder escolher qualquer engine!

Zabbix 2.X
Zabbix na nuvem
Integrao com APIs de nuvens:
Amazon EC2
Rackspace Cloud
VMWare
Monitoramento
Gesto (adicionar ou remover recursos sob demanda):
Carga de CPU alta => Adicionar um servidor novo na nuvem
Falta de armazenamento em disco => Adicionar um novo storage em nuvem

Zabbix 2.X
Agendador Global de tarefas
Ns j temos tudo para tornar isso possvel - Alexei Vladishev
Tipo de calendrio global para todo ambiente monitorado
Pode ser usado para:
Agendar backups e outras tarefas peridicas
Iniciar / desligar servidores fsicos e virtuais, recursos na nuvem
Execuo condicional de comandos, dependendo dos problemas existentes. Exemplo:
Desligue os ns do cluster noite, apenas se a carga da CPU estiver baixa.

Comunidade Brasileira

Zabbix 2.X
Fundada em junho de 2008 por Andr Do
962 membros
Site:
http://zabbixbrasil.org
Twitter:
http://twitter.com/zabbixbr
Wiki:
http://zabbixbrasil.org/wiki
Lista de discusso:
http://br.groups.yahoo.com/group/zabbix-brasil/
Planet:
http://planet.zabbixbrasil.org

Referncias
Site do Zabbix:
http://www.zabbix.com
Licena Zabbix:
http://www.zabbix.com/licence.php
Manual do Zabbix:
http://www.zabbix.com/documentation.php
Lista da Comunidade Brasileira:
http://br.groups.yahoo.com/group/zabbix-brasil

Referncias
Apresentaes:
Alexei Vladishev, Fundador do Zabbix Open Source Data Center Conference 2009
http://www.netways.de/osdc/y2009/programm/v/open_source_enterprise_monitor
ing_with_zabbix
Alexei Vladishev, Fundador do Zabbix Free Software that helps, FISL 12, 2011.
http://www.slideshare.net/zabbixbr/fisl12-2011
Luciano Alves, Unirede Solues Corporativas Monitoramento em Camadas
Latinoware 2013.

Contatos
E-mail Profissional:
deo@reitoria.unicamp.br
E-mail Pessoal:
andredeo@gmail.com
Blog:
http://andredeo.blogspot.com
Twitter:
@deoandre

Dvidas ?

You might also like