2.4. Que contr�ler�?
Comme nous l'avons mentionn� pr�c�demment, les ressources de tout syst�me se composent de la puissance de CPU, de la largeur de bande, de la m�moire et du stockage. Au premier abord, le contr�le ne semble porter que sur ces quatre �l�ments diff�rents.
Malheureusement, ce n'est pas aussi simple. Prenez par exemple un disque dur. Quel genre d'informations aimeriez-vous conna�tre au niveau de sa performance�?
Quelle est la quantit� d'espace disque libre�?
Combien d'op�rations d'E/S par seconde effectue-t-il en moyenne�?
Combien de temps faut-il en moyenne pour que chaque op�ration d'E/S soit effectu�e�?
Combien de ces op�rations d'E/S sont des op�rations de lecture�? Combien sont des op�rations d'�criture�?
Quelle est la quantit� moyenne de donn�es lues/�crites lors de chaque op�ration d'E/S�?
Il existe bien d'autres mani�res d'examiner la performance du disque dur�; les �l�ments pr�c�dents ne renseignent que tr�s superficiellement sur le sujet. Le concept essentiel qu'il convient de garder � l'esprit est que les donn�es de chaque ressource se pr�sentent sous diff�rents types.
Les sections suivantes examine les diff�rents types d'informations sur l'utilisation des ressources permettant de comprendre le comportement de chacun des principaux types de ressources.
2.4.1. Contr�le de la puissance de CPU
Le contr�le de la puissance de CPU dans sa forme la plus �l�mentaire peut en fait �tre une activit� plus difficile � effectuer que de d�terminer la possibilit� que l'utilisation du CPU atteigne 100%. Si l'utilisation du CPU reste inf�rieure � 100%, quelle que soit l'activit� du syst�me, une puissance de traitement suppl�mentaire est toujours disponible pour faire face � une activit� sup�rieure.
Toutefois, rares sont les syst�mes n'atteignant pas, � un moment ou � un autre, une utilisation � 100% du CPU. � ce stade, il est important d'examiner des donn�es plus d�taill�es sur l'utilisation du CPU. Ce faisant, il est alors possible de commencer � identifier l� o� la majorit� de la puissance de traitement est utilis�e. Ci-apr�s figurent certaines des statistiques les plus couramment consult�es en mati�re d'utilisation du CPU�:
- Utilisateur contre syst�me
Une comparaison du pourcentage de temps pass� � effectuer des op�rations de traitement au niveau de l'utilisateur par rapport � celui d�di� aux op�rations de traitement au niveau du syst�me, peut indiquer si une charge de travail est essentiellement due � l'ex�cution d'applications ou au temps de gestion du syst�me d'exploitation. Des pourcentages �lev�s au niveau des utilisateurs ont tendance � �tre positifs (� condition que les utilisateurs ne connaissent pas de performance insatisfaisante) alors que des pourcentages �lev�s au niveau du syst�me tendent � indiquer qu'il existe des probl�mes n�cessitant un examen plus d�taill�.
- Changements de contexte
Un changement de contexte se produit lorsque le CPU arr�te d'ex�cuter un processus particulier et en lance un autre. �tant donn� que tout changement de contexte demande que le syst�me d'exploitation prenne contr�le du CPU, des changements de contexte excessifs semblent aller de paire avec des degr�s �lev�s de consommation de CPU au niveau du syst�me.
- Interruptions
Comme le nom l'indique, les interruptions correspondent � des situations dans lesquelles un changement soudain intervient au niveau du traitement effectu� par le CPU. Des interruptions ont g�n�ralement lieu en raison d'une activit� mat�rielle (telle qu'un p�riph�rique d'E/S finissant une op�ration d'E/S) ou en raison d'un logiciel (tel que des interruptions logicielles qui contr�lent le traitement d'applications). �tant donn� que les interruptions doivent s'effectuer au niveau du syst�me, un taux �lev� d'interruptions entra�ne une consommation de CPU accrue au niveau du syst�me.
- Processus ex�cutables
Un processus peut �tre dans diff�rents �tats. Il peut, par exemple�:
Dans ces cas-l�, le processus n'a pas besoin du CPU.
Toutefois, apr�s un certain temps, l'�tat du processus change et ce dernier devient alors ex�cutable. Comme le nom l'indique, un processus ex�cutable est un processus capable d'effectuer un travail d�s qu'il est programm� pour recevoir du temps CPU. Ceci �tant, si plusieurs processus sont ex�cutables � un moment donn�, tous les processus ex�cutables sauf un[1] doivent attendre leur tour pour �tre trait� par le CPU. En contr�lant le nombre de processus ex�cutables, il est possible de d�terminer le degr�s de d�pendance de votre syst�me par rapport au CPU.
D'autres m�triques de performance refl�tant un impact sur l'utilisation du CPU ont tendance � inclure diff�rents services fournis par le syst�me d'exploitation aux processus. Ces derni�res peuvent inclure des statistiques relatives � la gestion de la m�moire, au traitement des E/S etc. Ces statistiques r�v�lent �galement que, lorsqu'un syst�me est sous surveillance, les informations fournies se recoupent. En d'autres termes, il se peut que les statistiques d'utilisation du CPU identifient un probl�me au niveau du sous-syst�me d'E/S ou que les statistiques d'utilisation de la m�moire r�v�lent un d�faut de conception au niveau d'une application.
Par cons�quent, lors du contr�le de la performance du syst�me, il n'est pas possible d'examiner une statistique particuli�re de mani�re enti�rement ind�pendante�; seulement en prenant en compte la situation globale est-il possible d'extraire des informations utiles de statistiques quelconques sur la performance.
2.4.2. Contr�le de la largeur de bande
Le contr�le de la largeur de bande est une op�ration plus difficile que celui des autres ressources d�crites ici. En effet, les statistiques de performance ont tendance � �tre bas�es sur les p�riph�riques alors que la plupart des endroits o� la largeur de bande est importante ont tendance � se trouver au niveau des bus reliant les p�riph�riques. Dans les cas o� plusieurs p�riph�riques partagent un bus commun, les statistiques fournies sur chaque p�riph�rique sembleront peut-�tre acceptables, mais la charge totale que ces p�riph�riques placent sur le bus est en r�alit� beaucoup plus importante.
Il peut se poser un autre d�fit au niveau du contr�le de la largeur de bande, lorsque les statistiques relatives aux p�riph�riques eux-m�mes ne sont pas disponibles. C'est pr�cis�ment la cas pour des bus d'extension du syst�me et pour les chemins des donn�es[2]. Toutefois, bien que des statistiques 100% pr�cises sur la largeur de bande ne soient pas toujours disponibles, il existe souvent suffisamment d'informations pour permettre un certain niveau d'analyse, en particulier lorsque d'autres statistiques sur le sujet sont prises en compte.
Parmi certaines des statistiques les plus courantes sur la largeur de bande figurent�:
- Nombre d'octets re�us/envoy�s
Les statistiques relatives aux interfaces r�seau fournissent une indication sur l'utilisation de la largeur de bande d'un des bus les plus visibles — le r�seau.
- D�comptes des interfaces et taux
Ces statistiques en relation avec le r�seau peuvent fournir entre autres des indications sur des collisions excessives, des erreurs de transmission et de r�ception. En utilisant ces statistiques (en particulier si elles sont disponibles pour plus d'un syst�me du r�seau), il est possible de r�soudre un certain nombre de probl�mes en relation avec le r�seau, avant m�me d'utiliser les outils de diagnostic du r�seau les plus courants.
- Transferts par seconde
G�n�ralement recueilli pour les p�riph�riques blocs d'E/S, tels que des lecteurs de disques durs et des lecteurs de bandes haute performance, ce type de statistiques est un bon moyen de d�terminer si la limite de la largeur de bande d'un p�riph�rique particulier est atteinte. En raison de leur nature �lectromagn�tique, les lecteurs de disques et de bandes peuvent seulement effectuer un nombre d�termin� d'op�rations d'E/S par seconde�; leur performance se d�t�riore rapidement au fur et � mesure que le nombre d'op�rations se rapproche de la limite.
2.4.3. Contr�le de la m�moire
S'il existe un domaine dans lequel les statistiques de performance abondent, c'est bien celui du contr�le de l'utilisation de la m�moire. En raison de la complexit� inh�rente aux syst�mes d'exploitation dot�s de m�moire virtuelle pagin�e � la demande, les statistiques relatives � l'utilisation de la m�moire prennent de nombreuses formes diff�rentes. C'est � ce niveau qu'a lieu la plupart du travail d'un administrateur de syst�me effectuant la gestion des ressources.
Les statistiques �num�r�es ci-dessous donnent un bref aper�u des statistiques de gestion de m�moire couramment disponibles�:
- Pages re�ues (In)/Pages transmises (Out)
Ces statistiques permettent d'estimer le flux de pages entre la m�moire du syst�me et les p�riph�riques de stockage de masse qui y sont reli�s (g�n�ralement les disques durs). Des taux �lev�s pour ces deux types de statistiques indiquent g�n�ralement que le syst�me est � court de m�moire physique et effectue des op�rations d'�croulement (ou thrashing) ou qu'il utilise plus de ressources syst�me pour charger des pages en m�moire et pour les d�charger, que pour ex�cuter des applications.,
- Pages actives/Pages Inactives
Ces statistiques indiquent le degr� d'utilisation des pages mises en m�moire. L'absence de pages inactives peut �tre le signe d'un manque de m�moire physique imminent.
- Pages libres, partag�es, tamponn�es et mises en cache
Ces statistiques fournissent de informations suppl�mentaire plus d�taill�es que celles relatives aux pages actives/inactives. Gr�ce � ces statistiques, il est possible d'obtenir une vue globale de l'utilisation vari�e de la m�moire.
- Swap Entrants/Swap sortants
Ces statistiques expliquent le comportement g�n�rale de l'�change de m�moire (ou swapping) du syst�me. Des taux excessivement �lev�s indiquent ici qu'il existe peut-�tre des probl�mes li�s � un manque de m�moire.
Pour bien contr�ler l'utilisation de la m�moire, il est n�cessaire de disposer d'une bonne compr�hension du fonctionnement des syst�mes d'exploitation dot�s de m�moire virtuelle pagin�e � la demande. Bien qu'un tel sujet pourrait faire l'objet d'un livre entier, nous nous contenterons d'aborder les concepts de base dans le Chapitre 4. En lisant ce chapitre et en passant du temps � effectivement contr�ler un syst�me, vous disposerez des bases n�cessaires pour ensuite approfondir vos connaissances sur le sujet.
2.4.4. Contr�le du stockage
En mati�re de stockage, il existe g�n�ralement deux types de contr�le diff�rents�:
Il est n�cessaire d'effectuer un contr�le aussi bien au niveau du disque qu'au niveau de la performance car il est tout � fait possible d'avoir de s�rieux probl�mes � un niveau et absolument aucun � l'autre. Par exemple, il est possible qu'un disque dur soit � court d'espace sans pour autant entra�ner de probl�me de performance. De m�me, il est possible qu'un disque dur, bien que disposant de 99% d'espace libre, fonctionne au-del� de sa capacit� en terme de performance.
Toutefois, il est plus probable qu'un syst�me moyen doive faire face � un manque de ressources aussi bien au niveau de l'espace disque qu'au niveau de la performance. Dans de telles circonstances, il y a �galement de grandes chances que — jusqu'� un certain point — des probl�mes � un niveau aient un impact sur l'autre niveau. Tr�s souvent ce type d'interaction entra�ne une performance d'E/S de plus en plus mauvaise au fur et � mesure qu'un disque dur approche de la barre des 0% d'espace libre� n�anmoins, dans des cas o� la charge d'E/S est extr�me, il est tout � fait possible de ralentir la capacit� de traitement des E/S � tel point que les applications ne puissent plus tourner correctement.
Dans tous les cas de figure, les statistiques suivantes sont utiles pour le contr�le du stockage�:
- Espace libre
L'espace libre est probablement la ressource que les administrateurs de syst�me surveillent le plus �troitement�; un administrateur ne contr�lant jamais l'espace libre sera un cas rarissime (ou alors, il dispose d'un certain processus de contr�le automatis�).
- Statistiques sur les syst�mes de fichiers
Ces statistiques (telles que le nombre de fichiers par r�pertoire, la taille moyenne des fichiers, etc.) fournissent des informations suppl�mentaires plus utiles que le simple pourcentage d'espace libre. Gr�ce � ces informations d�taill�es, les administrateurs peuvent configurer le syst�me de mani�re � optimiser la performance car la charge d'E/S impos�e par un syst�me de fichiers peupl� de petits fichiers n'est pas la m�me que celle correspondant � un syst�me de fichiers compos� d'un seul fichier �norme.
- Transferts par seconde
Ce genre de statistique constitue un bon moyen de d�terminer si les limites de la largeur de bande d'un p�riph�rique particulier ont �t� atteintes.
- Op�rations de lecture/�criture par seconde
Ces statistiques sous forme d'une ventilation l�g�rement plus d�taill�e des transferts par seconde permettent � un administrateur de syst�me de mieux comprendre la nature des charges d'E/S auxquelles un p�riph�rique peut �tre soumis. Cet aspect peut �tre critique dans la mesure o� certaines technologies de stockage ont des caract�ristiques de performance tr�s diff�rentes selon qu'elles traitent des op�rations de lecture ou des op�rations d'�criture.