linux:adminsys:check_replication_mysql
Ceci est une ancienne révision du document !
Check réplication mysql
Ce script vérifie les positions master et slave de deux noeuds mysql en réplication maitre-maitre.
#!/bin/bash # Ce script loggue les positions sur le master local, le master distant et le slave # Avec en colonnes # 1 timestamp # 2 master_log_on_remote_master # 3 master_log-pos_on_remote_master # 4 master_log_on_local_slave # 5 master_log-pos_on_local_slave # 6 master_log_on_local_master # 7 master_log-pos_on_local_master # 8 master_log_on_remote_slave # 9 master_log-pos_on_remote_slave # 10 date en plus clair # le user mysql qui réplique doit avoir les droits REPLICATION CLIENT, REPLICATION SLAVE et PROCESS LOG=/var/log/mysql/replication.log ERRLOG=/var/log/mysql/replication.err TMP=/tmp/$(basename $0).tmp DEST='mail@domaine.tld' DEBUG=0 # On regarde si on est sql1 ou sql2, à adapter suivant vos hostnames # ici on regarde le 3e caractère du hostname here=${HOSTNAME:2:1} [ $here -gt 1 ] && there=1 || there=2 local_host=<prefix>${here}.domaine.tld remote_host=<prefix>${there}.domaine.tld TS=$(date '+%s') # timestamp DATE=$(date -d "1970-01-01 UTC +$TS seconds" "+%Y-%m-%d_%H:%M:%S") user=$(sed -ne '5p'</var/lib/mysql/master.info) pass=$(sed -ne '6p'</var/lib/mysql/master.info) init_vars() { # marche pas si le $user a seulement les droits de réplication slave, il faut client remote_master=$(/usr/bin/mysql -u$user -p$pass -h$remote_host -e 'show master status'|awk 'END {print $1 " " $2}') remote_slave=$(/usr/bin/mysql -u$user -p$pass -h$remote_host -e 'show slave status'|awk -F '\t' 'END {print $6 " " $7}') remote_delay=$(/usr/bin/mysql -u$user -p$pass -h$remote_host -e 'show slave status\G'|awk '/Seconds_Behind_Master/ {print $2}') remote_error=$(/usr/bin/mysql -u$user -p$pass -h$remote_host -e 'show slave status\G'|grep Last_Error) # sinon on passe par ssh, mais root doit avoir une clé #remote_master=$(/usr/bin/ssh $remote_host '/usr/bin/mysql --defaults-file=/etc/mysql/debian.cnf -e "show master status"'|awk 'END {print $1 " " $2}') local_master=$(/usr/bin/mysql --defaults-file=/etc/mysql/debian.cnf -e 'show master status'|awk 'END {print $1 " " $2}') local_slave=$(/usr/bin/mysql --defaults-file=/etc/mysql/debian.cnf -e 'show slave status' |awk -F '\t' 'END {print $6 " " $7}') local_delay=$(/usr/bin/mysql --defaults-file=/etc/mysql/debian.cnf -e 'show slave status\G'|awk '/Seconds_Behind_Master/ {print $2}') local_error=$(/usr/bin/mysql --defaults-file=/etc/mysql/debian.cnf -e 'show slave status\G'|grep Last_Error) # check index du fichier de log remote_master_log_index=$(expr "$remote_master" : '[^\.]\+\.0*\([1-9]\+\)') local_slave_log_index=$(expr "$local_slave" : '[^\.]\+\.0*\([1-9]\+\)') local_master_log_index=$(expr "$local_master" : '[^\.]\+\.0*\([1-9]\+\)') remote_slave_log_index=$(expr "$remote_slave" : '[^\.]\+\.0*\([1-9]\+\)') # check positions remote_master_log_pos=$(expr "$remote_master" : '[^ ]* \(.*\)') local_slave_log_pos=$(expr "$local_slave" : '[^ ]* \(.*\)') local_master_log_pos=$(expr "$local_master" : '[^ ]* \(.*\)') remote_slave_log_pos=$(expr "$remote_slave" : '[^ ]* \(.*\)') } if [ $DEBUG -gt 0 ]; then init_vars echo "remote_master $remote_master" echo "local_master $local_master" echo "local_slave $local_slave" echo "remote_slave $remote_slave" echo "local_delay $local_delay" echo "remote_delay $remote_delay" echo "local_error $local_error" echo "remote_error $remote_error" echo "Fin debug, on sort" exit fi echo "$TS $remote_master $local_slave $local_master $remote_slave $DATE $local_delay $remote_delay" >> $LOG >$TMP init_vars # check un souci qcq if [ -z "$remote_master_log_index" -o -z "$remote_master_log_pos" ] || \ [ -z "$local_slave_log_index" -o -z "$local_slave_log_pos" ] || \ [ "$remote_master_log_index" -gt "$local_slave_log_index" ] || \ [ "$remote_master_log_pos" -gt "$local_slave_log_pos" ] || [ "$local_delay" -gt '2' ] || \ [ -z "$local_master_log_index" -o -z "$local_master_log_pos" ] || \ [ -z "$remote_slave_log_index" -o -z "$remote_slave_log_pos" ] || \ [ "$local_master_log_index" -gt "$remote_slave_log_index" ] || \ [ "$local_master_log_pos" -gt "$remote_slave_log_pos" ] || [ "$remote_delay" -gt '2' ] then # 2e chance sleep 5 init_vars fi # connexion distante if [ -z "$remote_master_log_index" -o -z "$remote_master_log_pos" ]; then echo "Problème pour se connecter au master mysql distant de $remote_host ($remote_master)" >> $TMP # connexion locale elif [ -z "$local_slave_log_index" -o -z "$local_slave_log_pos" ]; then echo "Problème pour se connecter au slave mysql local de $local_host ($local_slave)" >> $TMP # fichier slave local trop vieux elif [ $remote_master_log_index -gt $local_slave_log_index ]; then echo "Le fichier de log est plus recent sur le master $remote_host ($remote_master) que sur le slave $local_host ($local_slave)" >> $TMP echo -e "Sur le slave de $local_host on a l'erreur :\n$local_error" >> $TMP echo "On restart le slave de $local_host" >> $TMP /usr/bin/mysql --defaults-file=/etc/mysql/debian.cnf -e 'stop slave; start slave;' >> $TMP # position slave local en retard elif [ $remote_master_log_pos -gt $local_slave_log_pos ] || [ "$local_delay" -gt '2' ]; then echo "Le slave de $local_host est en retard de ${local_delay}s (slave $local_slave_log_pos vs $remote_master_log_pos pour le master distant) : master $remote_host : $remote_master slave $local_host : $local_slave" >> $TMP echo -e "\nSur le slave de $local_host on a l'erreur :\n$local_error" >> $TMP echo "\nOn restart le slave de $local_host" >> $TMP /usr/bin/mysql --defaults-file=/etc/mysql/debian.cnf -e 'stop slave; start slave;' >> $TMP 2>&1 fi # on recommence avec le slave distant if [ -z "$local_master_log_index" -o -z "$local_master_log_pos" ]; then echo "Problème pour se connecter au master mysql local de $local_host ($local_master)" >> $TMP elif [ -z "$remote_slave_log_index" -o -z "$remote_slave_log_pos" ]; then echo "Problème pour se connecter au slave mysql distant de $remote_host ($remote_slave)" >> $TMP elif [ $local_master_log_index -gt $remote_slave_log_index ]; then echo "Le fichier de log est plus recent sur le master $local_host ($local_master) que sur le slave de $remote_host ($remote_slave)" >> $TMP echo -e "Sur le slave de $remote_host on a l'erreur :\n$remote_error" >> $TMP echo "On restart le slave de $remote_host" >> $TMP /usr/bin/mysql -u$user -p$pass -h$remote_host -e 'stop slave; start slave;' >> $TMP elif [ $local_master_log_pos -gt $remote_slave_log_pos ] || [ "$remote_delay" -gt '2' ]; then echo "Le slave de $remote_host est en retard de ${remote_delay}s (slave $remote_slave_log_pos vs $local_master_log_pos pour le master local) : master $local_host : $local_master slave $remote_host : $remote_slave" >> $TMP echo -e "Sur le slave de $remote_host on a l'erreur :\n$remote_error" >> $TMP echo "On restart le slave de $remote_host" >> $TMP /usr/bin/mysql -u$user -p$pass -h$remote_host -e 'stop slave; start slave;' >> $TMP fi # et mail en cas de pb if [ $(wc -l <$TMP) -gt 0 ]; then # on ajoute le check des Slave_running ($user doit avoir les droits PROCESS) echo -e "\nSur $local_host on a $(/usr/bin/mysqladmin -u$user -p$pass extended-status|grep Slave_running)" >> $TMP echo "Sur $remote_host on a $(/usr/bin/mysqladmin -u$user -p$pass -h$remote_host extended-status|grep Slave_running)" >> $TMP echo -e "\nFin du script de check ($DATE)" >> $TMP # log cat $TMP >> $ERRLOG # on envoie un mail mail -a "Content-Type: text/plain; charset=UTF-8" -s "$DATE Replication mysql cassee ($0 sur $HOSTNAME)" $DEST < $TMP # et on pose un lock cat $TMP >> $LOCK else [ -f $LOCK ] && \ echo -e "\n$DATE : 1re constatation de la résolution du problème, synchro mysql OK" >> $LOCK && \ mail -a "Content-Type: text/plain; charset=UTF-8" -s "$DATE Replication mysql OK ($0 sur $HOSTNAME)" $DEST < $LOCK && \ rm -f $LOCK fi
linux/adminsys/check_replication_mysql.1265888433.txt.gz · Dernière modification : 11/02/2010 12:40 de daniel