Plataforma Virtualizacion. Proxmox. Monitorizacion.
Buenas.
Aqui andamos haciendo cosillas.
Ya tengo un parque de servidores y máquinas virtuales por ahi sin saber como están, ni como les gustaria estar, o me gustaria a mi como estuvieran. Asi que ni corto ni perezoso me he decidido por fin a crear el servidor de monitorización. Cosa curiosa que he probado tres sistemas:
1-. Pandora FMS. Algo liadillo pero con muy buena pinta en cuanto a los agentes y usar los agentes como proxys para otros dispositivos en redes locales a los que no se tendria acceso de otro modo.
2-. Zabbix, del estilo de Pandora y además completamente OpenSource, pero soy muy obtuso, y por desgracia no me llevo bien con los agentes.
3-. El archiconocido Nagios, sencillo, sin complicaciones, y muy constrastado, yo he trabajado con él en varias empresas y no tiene nada que envidiar a soluciones más complejas de monitorización, como servicios de HP que muy guais pero verdaderos truños para configurar, o los dos anteriores.
Asi que este artículo, sino se nota, va de Nagios.
Yo no me he complicado la cabeza, me he descargado las fuentas en una debian y he compilado. Eso si tienes que hacer dos compilaciones por un lado el core de nagios y por el otro los plugins. Para enviar correo, que se me habia olvidado, he tenido que descargar el código del paquete sSMTP y compilarlo también, no me he querido complicar la vida instalando y configurando un servidor SMTP completo. Solo quiero usar una cuenta: nagios; y enviar los correos desde mi dominio.
Otra cuestión es que tienes que descargar en el equipo a monitorizar NRPE, y lo tienes que configurar para que acepte peticiones desde la IP donde está el servidor de Nagios. Como tengo un DDNS configurado, pues me arreglé un script para que detecte los cambios en la IP, y me haga un sed en el archivo de configuración para que me acepte la nueva IP, y hecho el cambio compruebo y reinicio el servicio.
Voy a monitorizar los siguientes elementos:
1. el servicios SSH, de forma remota abriendo el puerto (inseguro) y comprobando que está UP.
2. el servicios web , https://FQDN:8006, abriendo el puerto (inseguro otra vez) y comprobando que está UP.
3. los discos con smartctl para comprobar que no están reasignando sectores. Sintoma de que el disco está fallando.
4. los raid de software para comprobar que están ok, de forma que detecto el SPARE haya entrado en el raid.
5. la ocupación del disco, para no llevarme la sorpresa de que se haya llenado el disco con los backups.
De esta forma tengo controlado los servidores de MV, de forma que no tenga problemas por:
1. servidor caido por averia de hardware o corte de tensión.
2. servidor caido por falta de espacio,
3. servidor caido por averias de discos,
4. el estado de los discos duros de los raids, para cambiar lo antes posibles el disco averiado si no ha funcionado la alarma para evitar el paso 3.
Bueno, con esto creo que todo estaría ok. Hay otros servicios de agentes como NCPA, y otros, que no he investigado pero están más integrados con los servidores Windows, de todos modos con hacerles consultas WMI es más que suficiente para saber que tal están estos sistemas.
Con esto y un bizcocho hasta otra.
Comentarios
Publicar un comentario