S’il te plaît, dessine-moi une poldoc (1/2)

Comme annoncé dans le précédent billet, voici un tutoriel pour réaliser des graphiques sur deux données utiles à l’évaluation des collections : la formule de répartition dite de Larbre-Dousset et les taux de rotation. L’astuce à retenir pour ces deux représentations, sous Excel comme sous Calc, est de faire cohabiter deux types de graphiques : les aires et les courbes.

Pour mémoire, la méthode Larbre-Dousset permet de calculer comment, en conservant la même volumétrie totale, devrait se répartir la collection de façon proportionnelle aux prêts. La formule originelle pourrait se décrire grossièrement en « volumétrie du tout multiplié par les prêts de la partie, divisé par les prêts du tout ». Comme cette formule de base aurait tendance à sur-représenter les classes qui ont les plus forts taux de prêts et écraser les classes qui sortent peu, l’astuce de LD consiste à pondérer le résultat par deux exposants, 2/3 et 3/4, donnant à chaque catégorie un maximum et un minimum. Vous pouvez télécharger cet exemple de « calculette » vierge de données (calcul_larbre-dousset), pouvant éventuellement s’appliquer à une petite bibliothèque de quartier.

1. Données nécessaires : volumétrie par domaines, prêts sur l’année écoulée, objectifs Labre-Dousset à 2/3 et à 3/4 (calculés grâce aux deux premières données).

2. Traitement des données. Un premier toilettage s’impose. Le calcul de LD implique de définir des sous-ensembles significatifs (section adultes versus section jeunesse, par exemple). Il faut donc retirer les sous-totaux nécessaires à ce calcul.

Il importe également de faire apparaître les classes Dewey en colonnes et les items Larbre-Dousset en lignes, grâce à la fonction « Collage spécial » (valeurs – transposé).

Il faut ensuite trier les résultats de manière à avoir les minimum sur une ligne et les maximums sur une autre. En effet, les résultats obtenus avec l’exposant 2/3 sont tantôt supérieurs, tantôt inférieurs aux résultats avec l’exposant 3/4. On utilise donc la formule =GRANDE.VALEUR(LD1:LD2;1) pour le maximum, et  pour le résultat inférieur, on remplace la valeur 1 par 2. Méthode alternative pour un résultat équivalent, utiliser respectivement la formule =MAX(LD1:LD2) et =MIN(LD1:LD2).

LD1Afin de représenter sous forme d’aire l’écart entre le minimum et le maximum de collections recommandés, il faut enfin calculer la différence entre les deux.

calculLD23. Etape facultative. En gardant le classement par grands domaines (adultes / jeunes, puis fiction / documentaires), la présentation est plus cohérente intellectuellement, mais elle dessine une courbe erratique moins immédiatement lisible. Je propose donc de trier les résultats par ordre croissant (sur le LD le plus élevé).

4. Réalisation du graphique. Après avoir sélectionné les données finales, ouvrir la boite de dialogue « Assistant graphique », puis dans « Type de graphiques », sélectionner « Aires » et « Aires empilées ». On nettoie ensuite de toutes les options inutiles que le logiciel propose par défaut : à quoi bon faire apparaître une échelle graduée sur l’axe des ordonnées si l’on fait apparaître la valeur de chaque point sur le graphique ? La légende et le quadrillage sont également superflus, dans notre cas. Voici donc à quoi ressemble notre graphique à cette étape :

graphLD1Il s’agit maintenant de transformer l’aire la plus basse du graphique (zone en lilas) pour en faire une courbe. Pour cela, faire un clic droit sur l’aire en question, puis « Type de graphique » et sélectionner « Courbes ». Pour arriver au résultat final, j’ai retravaillé l’aspect visuel proposé par défaut, toujours par clics droits, en changeant la couleur, supprimant les bordures, ajouté des étiquettes de valeurs à la courbe de la volumétrie, supprimé le magnifique gris souris de la « zone de traçage », etc. Ce qui donne ceci :

graphLD26. Interprétation. Du premier coup d’oeil, on voit les domaines documentaires en « surcharge pondérale » (qui apparaissent au-dessus de l’aire de couleur verte) et ceux en quantité insuffisante (qui sont en dessous). Reste, comme d’habitude, à confronter ces observations aux objectifs : si on a décidé d’avoir un fonds théâtre de référence, il est naturel que celui-ci dépasse les quotas recommandés par la formule de LD…

Deuxième graphique : les taux de rotation

1. Données nécessaires. Comme précédemment, seuls les volumétries par domaines et les prêts annuels suffisent à calculer le TR (prêts annuels / nombre d’exemplaires).

2. Traitement des données. Afin de créer en arrière-fond de la courbe elle-même des « zones » (la zone moyenne, la zone extrême, etc.), on applique la même méthode que pour le graphique précédent : on fait cohabiter dans le graphique la représentation en aire et la représentation par courbe. On ajuste donc les chiffres en fonction des moyennes de la bibliothèque concernée, en identifiant le TR le plus élevé, grâce à la formule =MAX :

calculTR1Dans mon exemple, le taux de rotation le plus bas est très proche de zéro. J’ai donc simplement pris le parti de diviser en 3 zones égales l’écart entre zéro et mon TR maximum.

calculTR33. Réalisation du graphique. On saisit les données suivantes : les intitulés, les taux de rotation, les 3 colonnes avec la taille des zones souhaitées. On génère ensuite une première version du graphique en aires, avec la méthode décrite ci-dessus. Comme d’habitude, on supprime de cette première mouture les éléments parasites (quadrillage, légende, graduation des ordonnées…). On obtient ceci :

graphTR1Un clic droit sur la zone inférieure, qu’on transforme en courbe, quelques retouches de design et voici le résultat :

graphTR2

En cas d’important écart-type entre les taux de rotation extrêmes, il peut être utile de matérialiser le taux de rotation de l’ensemble de la collection (attention à toujours retirer du calcul le taux de rotation des revues). Il suffit alors d’ajouter au tableau une colonne où sera répété ce taux de rotation moyen de la collection, puis de transformer l’aire ainsi calculée en courbe. Dans l’exemple ci-dessous, j’ai aussi modifié le style de la ligne (pointillé) et coché « aucune » dans la rubrique « Marque ». Si vous préférez les courbes lissées aux lignes brisées, sélectionnez « Lissage » dans l’onglet « Motifs ».

graphTR34. Interprétation. Lorsqu’on est dans la zone supérieure, un seul diagnostic : pas assez de documents dans le segment concerné. Dans la zone médiane : pas interprétable en tant que tel, ou bien en relation avec les chiffres des années précédentes (pointer par exemple une chute ou une élévation suite à un désherbage un peu trop radical). Dans la zone la plus claire, plusieurs diagnostics sont possibles : fonds vieillissant, excès de documents, mauvaise visibilité, etc.

Evidemment, la représentation garde sa part d’arbitraire (définition de la zone “moyenne”, d’ailleurs ajustable), mais elle permet de voir d’emblée les zones éventuellement problématiques et les interprétations possibles. Elle vient confirmer ou nuancer les prescriptions de l’objectif de LD. Livré à lui seul, le taux de rotation est un peu le placebo de la politique documentaire : un outil mou mais rassurant car bien connu. L’évaluation des collections se fera donc toujours en croisant plusieurs indicateurs ; pour reprendre une formule lue dernièrement dans un manuel de statistique : “ne pas chercher la preuve absolue, préférer l’accumulation d’indices”…

Cet article a été publié dans Acquisitions, désherbage. Ajoutez ce permalien à vos favoris.

4 commentaires pour S’il te plaît, dessine-moi une poldoc (1/2)

  1. Ping : Tweets that mention S’il te plait, dessine-moi une poldoc (1/2) | Lirographe -- Topsy.com

  2. Ghyamphy dit :

    Tout d’abord un grand merci pour l’excellence pratique de votre billet ! Une question qui n’en demeure pas moins pratique aussi : comment obtient-on les résultats en appliquant l’exposant 2/3 et 3/4. A quoi correspondent-ils ? Voilà la question d’un béotien et merci d’une réponse votre part.
    Koffi Ghyamphy, BM de Tours.

    • Lirographe dit :

      Merci à vous pour vos encouragements ; l’exercice du tutoriel est toujours un peu ingrat, chronophage et suscitant peu de commentaires. Votre réaction n’en est a que plus d’intérêt !
      Concernant le calcul de Larbre-Dousset lui-même, je vous renvoie à ce précédent article :
      https://lirographe.wordpress.com/2009/12/18/qui-a-peur-de-larbre-dousset/
      Ainsi qu’à ce texte des auteurs de la méthode, un peu aride mais très complet :
      http://bbf.enssib.fr/consulter/bbf-1988-04-0266-001
      Vous y verrez pourquoi les deux exposants 2/3 et 3/4 sont utilisés (somme toute, de façon relativement empirique, car, non, la poldoc n’est pas une science exacte !).

      Pour répondre à votre question « comment obtient-on les résultats en appliquant l’exposant 2/3 et 3/4 », le meilleur moyen de comprendre une formule étant de l’appliquer, je vous invite à télécharger la calculatrice excel en lien dans l’article : https://lirographe.files.wordpress.com/2011/01/calcul_larbre-dousset.xls
      En deux mots, au lieu d’appliquer simplement la formule « volumétrie du tout multiplié par les prêts de la partie, divisé par les prêts du tout », on obtient : « volumétrie du tout multiplié par puissance 2/3 des prêts de la partie, divisé par puissance 2/3 des prêts du tout ». Puis la même chose avec l’exposant 3/4. En espérant avoir été plus clair, ce qui n’est jamais facile par écrit, sur ce genre de sujets…

  3. Ping : sagtiv | Pearltrees

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s