Annonces et soucis techniques

Juil
2012

Fil réservé aux annonces de l’équipe technique, et à la rémontée des problèmes techniques.


Mise à jour le 29/07/12 à 20h35
Un nouveau blocage du SGBD a eu lieu, toujours avec les mêmes raisons et symptômes, induisant une indisponibilité de près d’une heure.


Mise à jour le 29/07/12 à 15h20
Fin d’une nouvelle opération de maintenance sur le SGBD commencée à 13h25.


Mise à jour le 29/07/12 à 00h55
Fin d’une opération de maintenance sur le SGBD commencée à 00h30.


Mise à jour le 28/07/12 à 17h45
Technique: Les écritures disque induites par les flush du SGBD continuent à saturer les I/Os, nous passons en revue les différentes possibilités de contourner ce problème avec le matériel dont nous disposons.


Mise à jour le 28/07/12 à 16h00
Une nouvelle maintenance sur la base de données a induit une indisponibilité de 15h30 à 16h00 environ.
Technique: Toutes les optimisations possibles ayant déjà été réalisées sur les tables en InnoDB, le choix a été fait de dropper tous les index FULLTEXT de la dernière table MyISAM (responsable de la plupart des locks) et de la basculer en InnoDB.
L’opération s’est bien déroulée, plus rapidement que prévue. Nous maintenons une surveillance accrue sur le SGBD.


Mise à jour le 28/07/12 à 14h15
Technique: Après une petite heure d’observations la taille du binlog a été ré-optimisée. Un gain notable en I/O est observé, nous conservons le SGBD sous monitoring poussé quelques temps pour valider.


Mise à jour le 28/07/12 à 13h15
Une opération de maintenance a été requise sur la base de données. Ceci a induit une indisponibilité de 13h00 à 13h10.
Technique: Le taux d’écriture qu’encaisse le SGBD induit des flush fréquents sur les disques. Aucun problème en fonctionnement « normal », mais les I/O bloquent lors des pics notamment du fait des opérations internes à l’applicatif.
Augmentation de la taille des binlogs pour espacer les flush et lisser les I/O.


Mise à jour le 27/07/12 à 22h45
Le fonctionnement général avec la configuration actuelle semble satisfaisant, les différents retours le confirment.
Si cet état de fait se maintient sur plusieurs jours nous pourrons considérer la situation comme stabilisée.


Mise à jour le 27/07/12 à 15h11
Tentative de relâchement des règles de cache: risques d’instabilité en perspective.


Mise à jour le 27/07/12 à 12h45
Suite à l’optimisation de la base de données ce matin, nous tenterons de réduire la dureté du cache cet après-midi.