Monitoring de fonctionnement des ASTRADs et DBAs

André Guimarães, 2012-09-10

Oussama Hammami, 2011-07-27

Switzernet

 

Cette page permit vérifier s’il y a des problèmes de réplication o de fonctionnement dans tous nos serveurs de VoIP (Astrads)  et de bases de données (DBAs/PBSs). Il peut être utilisé aussi pour vérifier la réplication entre quelques deux serveurs.

 

Ce graphique montre :

-          l'état ​​de la réplication (lignes avec ->). Pour ça le temps entre la position du binlog actuel du master et du slave sont comparé. C’est aussi possible faire la comparaison entre le numéro de lignes de chaque table replié et le md5 du contenu ;

-          l’état de la réplication de enregistrements entre chaque DBA (dbX). S’il y a un problème  de écriture entre deux ou plus serveurs sur la table de enregistrement un erreur est affiché;

-          l’état des serveurs de VoIP Astrad (AstradXX).

 

Fichier d’installation [tgz]

Lien de monitoring [www]

 

Légende :

Vert : fonctionnement normal

 

Orange : warning

- La position du curseur dans le Slave est différente que celle du Master s’il s’agit du monitoring de la réplication MySQL.

- Le Min des Max des dates de réception d’enregistrement SIP regroupés par serveur est entre 60 et 150 seconds.

SELECT MIN(max_register) as register,NOW(),TIMESTAMPDIFF(SECOND,MIN(max_register),NOW()) as diff, CASE WHEN TIMESTAMPDIFF(SECOND,MIN(max_register),NOW())<60 THEN "1" ELSE CASE WHEN TIMESTAMPDIFF(SECOND,MIN(max_register),NOW())<150 THEN "2" ELSE "3" END END as vr from (select username,domain,MAX(register) as max_register , 1 as grp from location2 group by domain) as loc group by grp;

 

Rouge : Erreur

- Erreur dans la réplication MySQL (show slave status affiche une erreur).

- Un des services d’Astrad est arrêté.

- Le Min des Max des dates de réception d’enregistrement SIP regroupés par serveur dépasse 150 second qui présente la valeur maximal d’expire.

 

Gris : aucune entrée dans la base des données

 

Les cellules du graph. de monitoring sont cliquables.

Exemple :

- Erreur dans la réplication master -> db2

 

- Warning, la différence entre NOW() et max register est dans l’intervalle [60 - 150] seconds

- Normal les services d’Astrad (asterisk + les scripts Perl) fonctionnent correctement.

Installation

Lire Readme.txt inclut dans le fichier tgz.

 

Configuration

Après une installation o si un nouveau serveur est ajouté, c’est nécessaire actualiser les fichiers de configuration:

- 110726-monitor/connection.php

- 110726-check-replication/check-rep.conf

- 110725-check-dba/check-dba.conf

A faire

Ajouter aussi le temps de exécution de la réplication. Maintenant nous vérifions seulement se nous lisons du master. Si le temps de exécution de les requêtes repliés prendre beaucoup de temps, la base de donnés c’est effectivement en retard mas cette problème n’est pas affiché.

Référence

Normality Monitoring

http://portasip-monitor.switzernet.com/110726-monitor/view.php

 

Fichier d’installation [tgz]

 

Astrad versions

http://switzernet.com/3/public/110126-astrad-versions/

 

Versions du Master MySQL-Astrad  DBA

http://switzernet.com/3/public/110317-db3-versions/