Lecture n°11 : Show me the Numbers par Stephen Few

 

Enfin !  Le dernier livre du bloc « Communication » du Personal  MBA : Show me the Numbers. C’est le livre ultime sur le design de graphes et de tableaux. Avant d’ouvrir ce livre, je ne me rendais pas compte à quel point ce sujet est complexe et méritait un ouvrage entier.

 

Chapitre 1 : Introduction

 

L’utilisation de tableaux et de graphiques est chose commune aujourd’hui dans le monde de l’entreprise, pourtant peu nombreux sont ceux qui ont appris les bonnes pratiques du design pour les rendre efficaces.

Le monde de l’entreprise se base sur les chiffres, les tableaux et les graphes pour évaluer les choses et prendre des décisions. Les chiffres ont de la valeur, pour cette raison, il faut savoir comment les présenter. Parfois du temps est perdu à essayer de comprendre le sens des nombres dans un tableau ou le sens d’un graphe.

Les tableaux et les graphes sont le meilleur moyen de communiquer de l’information que Stephen Few appelle « quantitative ». Ils sont si communs aujourd’hui que les gens pensent savoir comment les utiliser au mieux. C’est souvent faux.

Malgré leur place prépondérante dans les affaires aujourd’hui, les graphes sont seulement employés depuis quelques siècles. C’est l’avènement du PC qui a fait exploser l’usage des tableaux et des graphes, et qui a rendu leur utilisation très simple alors qu’avant il fallait déployer des efforts incroyables pour tracer une courbe sur du papier. Cette facilité nous a fait oublier l’objectif de l’information quantitative : apporter au lecteur des informations avec du sens, en plus d’être utiles.

L’avantage, c’est qu’il ne faut pas plus de temps pour produire des graphes inutiles que des graphes utiles.

Ce livre se concentre sur les tableaux et les graphes directement utilisables dans les reporting business, ainsi que sur la communication et le design. Ce n’est pas un livre sur les techniques d’un tableur comme Excel.

Les tableaux et les graphes d’informations quantitatives peuvent être utilisés de quatre manières :

–       analyser

–       monitorer

–       planifier

–       communiquer

C’est pour cette raison que ce livre n’est pas réservé aux analystes financiers, mais bien à tout l’organigramme d’une entreprise, parce que les tableaux et les graphes sont rentrés dans la culture d’entreprise.

Les tableaux et les graphes diffèrent parce que d’un côté les tableaux présentent l’information de façon verbale (l’information est présentée de manière séquentielle) quand d’un autre côté les graphes présentent l’information de manière visuelle (le sens de l’information est immédiatement accessible en un coup d’œil).

Aucune méthode n’est mieux que l’autre, l’utilisation d’un tableau ou d’un graphe dépend des cas. Tout cela est abordé dans le livre.

 

Chapitre 2 : Des nombres qu’il vaut mieux connaître

 

Ce sont les chiffres et les nombres qui vont nous permettre de constituer des tableaux et des graphes. Il existe certains types de chiffres qu’il vaut mieux connaître avant d’attaquer la construction et la présentation de tableaux et de graphes, très utiles dans la communication d’informations quantitatives.

L’information quantitative présente toujours une relation. Il n’existe pas de graphes sans au moins un axe, ou de tableaux sans au moins deux colonnes ou deux lignes, au minimum. L’information quantitative présente deux types de données : les données quantitatives et les données de catégorie. Les données quantitatives mesurent les choses, les données de catégorie divisent ces choses en groupes utiles, comme par exemple la géographie ou le temps. Cette distinction est fondamentale.

Parfois les relations présentées par notre information quantitative peuvent être une relation entre plusieurs jeux de données quantitatives (le volume de ventes en fonction du volume de lettres envoyées). En fonction du type de relation, il faudra adapter sa manière de la présenter.

Les relations au sein des données de catégorie sont de quatre types :

–       nominales

–       ordinales

–       intervalles

–       hiérarchiques

Les relations nominales ne sont pas reliées dans un ordre particulier. Par exemple « nord, ouest, est, sud ».

Les relations ordinales demandent un certain ordre. Par exemple « un, deux trois » ou « petit, moyen, grand ».

Les relations intervalles reposent sur des… intervalles, dans un ordre descendant ou un ordre ascendant. Par exemple « de 0 à 1000, de 1001 à 2000, … ». L’échelle de temps est aussi un jeu de données par intervalles.

Les relations hiérarchiques impliquent plusieurs niveaux hiérarchiques reliés chacun aux autres dans un classement ordonné.

 

 

Les relations au sein des données quantitatives sont de trois types :

–       rang

–       ratio

–       corrélation

Le rang implique que les catégories soient rangées en fonctions des données quantitatives, généralement dans un classement du plus grand au plus petit, pour faire comprendre au lecteur quels éléments sont importants.

Le ratio est une relation entre deux nombres dans laquelle un nombre divise l’autre. Le résultat exprime leur quantité relative. Le ratio d’une part par rapport à l’ensemble est généralement exprimé en pourcentage. C’est un outil très efficace pour remplacer des nombres difficilement exploitables par notre public, car la valeur référence de 100 donne un outil simple à utiliser à nos lecteurs pour faire des comparaisons. Une autre utilisation courante du ratio est la mesure du changement (+6% de ventes).

La corrélation est une relation entre deux jeux d’informations quantitatives qui sont comparés pour déterminer si l’un augmente ou diminue quand l’autre augmente ou diminue. Par exemple, y a-t-il une corrélation entre l’expérience des employés et leur productivité ?

En plus de ces relations, les statistiques proposent de nombreuses méthodes pour résumer l’information quantitative, appelée parfois l’agrégation. C’est très utile pour nous quand nous disposons de nombreux chiffres pour ainsi les réduire en quelques chiffres clés directement exploitables.

L’agrégation pet être purement visuelle dans un graphe (chapitres suivants) ou purement statistique. Les plus utiles dans le business sont les mesures de moyenne, de distribution, de corrélation et de ratio.

 

Les mesures de moyenne

 

Il faut savoir distinguer la moyenne (la somme de toutes les valeurs divisées par le nombre de valeurs additionnées) et la médiane (au-dessus et en-dessous de la médiane il y a exactement la moitié des valeurs de notre jeu de données).

L’intérêt de la médiane est qu’elle est insensible aux grands écarts entre les valeurs. Imaginons par exemple une entreprise de dix employés, dans laquelle le PDG gagne 200 000 euros et les neuf autres employés 30 000 euros (je force le trait). Le salaire moyen est de 47 000 euros, ce qui n’a pas trop de sens car 9 employés sur 10 sont en-dessous.

 

Les mesures de distribution

 

Parfois il est nécessaire de communiquer plus qu’une moyenne, mais aussi sa répartition (distribution) par exemple dans le temps. Ainsi on peut imaginer découvrir que les ventes de notre entreprise en janvier ne représentent, sur les 10 dernières années, que 4% des ventes annuelles, malgré des campagnes marketing importantes. Dans ce cadre, pourquoi continuer à investir pour booster les ventes en janvier ?

La plus utile de ces mesures de distribution en business est sans doute la déviation standard, qui mesure l’écart d’un jeu de données quantitatives par rapport à leur moyenne.

Par exemple, la distribution de ce jeu de données :

 

 

peut être exprimé ainsi :

 

 

Les mesures de corrélation

 

La corrélation est une relation entre deux jeux d’information quantitative qui sont comparés pour déterminer si l’un augmente ou diminue quand l’autre augmente ou diminue. Par exemple, y a-t-il une corrélation entre l’expérience des employés et leur productivité ?

Cette relation peut être linéaire ou non-linéaire.

 

 

 

Les mesures de ratio

 

A l’inverse de la corrélation, qui mesure des la relation entre deux jeux de données, le ration mesure la relation entre deux nombres. La marge est par exemple un ratio très utilisé en business (quel est le rapport entre l’argent que je gagne réellement en vendant un produit et le prix de vente du produit ?).

Une autre utilisation intéressante des ratios est de comparer un jeu de nombres à un nombre particulier. Exemple : le ration entre le chiffre d’affaires de chacun de mes concurrents et le mien.

 

 

Chapitre 3 : Concepts fondamentaux des tableaux et des graphes

 

Les bonnes pratiques dans la construction et la présentation des tableaux et des graphes ne sont pas difficiles à apprendre.

Les messages quantitatifs peuvent être séparés en deux types de données :

–       les données quantitatives (les nombres)

–       les données de catégories (ce que les nombres mesurent)

Quand faut-il utiliser des tableaux ? Les tableaux offrent un bénéfice immédiat : ils rendent facile le fait de chercher les données. Quand on se demande qu’utiliser entre un graphe et un tableau, il faut essayer de se mettre à la place de notre public et de savoir comment seront utilisées les données. Est-ce que notre public va chercher des valeurs bien précises (dans ce cas le tableau est à préférer) ou des schémas entre ces valeurs (dans ce cas le graphe sera privilégier) ?

Les tableaux étant encodés textuellement, ils sont donc par nature précis contrairement aux graphes. Une autre force des tableaux est de pouvoir inclure de nombreuses unités de mesure (le nombre d’unités vendue, leur prix, un pourcentage de marge, …) ce qui est impossible à faire sur un seul graphe.

Les graphes encodent l’information visuellement, dans une aire délimitée par un ou plusieurs axes exprimant des échelles, comme des objets positionnés par rapport à ces axes.

 

 

L’idée de ce graphe n’est pas de donner les chiffres de ventes exacts mais de donner l’information que les ventes ont globalement augmenté en 2003, avec des retombées au début de chaque trimestre. Ce « pattern » dans les données est beaucoup plus difficile à exprimer dans un tableau.

Le graphe est donc un objet qui va donner une forme aux données quantitatives. Cette forme va nous révéler des informations en un seul coup d’œil : les changements, les différences, les similarités, les exceptions. Les graphes peuvent exprimer des relations quantitatives bien plus complexes que les tableaux.

Leur force, c’est de permettre la compréhension immédiate d’un grand jeu de données.

 

Chapitre 4 : Variations fondamentales des tableaux

 

Ce chapitre couvre ce que les tableaux peuvent servir à représenter et comment les représenter.

Les tableaux peuvent être utilisés pour montrer cinq types de relations, qui peuvent être séparées en deux :

–       les relations entre les catégories et les informations quantitatives :

entre un jeu de valeurs quantitatives et un jeu de catégories

entre un jeu de valeurs quantitatives et l’intersection de catégories multiples

entre un jeu de valeurs quantitatives et l’intersection de catégories hiérarchiques

–       les relations entre des informations quantitatives et d’autres informations quantitatives

Au sein d’un même jeu de valeurs quantitatives associées à de multiples catégories

Au sein d’un même jeu de valeurs quantitatives associées à la même catégorie

En terme de design, les tableaux subissent deux variations : une structure unidirectionnelle (la lecture du tableau se fait dans un seul sens) et une structure bidirectionnelle (la lecture du tableau se fait à la fois verticalement et horizontalement).

 

 

 

L’avantage de la structure bidirectionnelle est qu’elle prend moins d’espace pour les mêmes informations.

 

Chapitre 5 : Variations fondamentales des graphes

 

Les graphes montrent toujours des relations. Leur force réside dans leur exceptionnelle capacité à présenter visuellement des relations complexes.

Les graphes sont constitués de quelques composants (échelles et axes, lignes, barres, légende…). Certains composants représentent des valeurs quantitatives (lignes, barres, …), d’autres représentent des catégories, et d’autres ont un rôle de support à l’information. Les variations structurelles des graphes sont d’abord définies par les différences entre les composants qui encodent les valeurs quantitatives (des lignes ou des barres ?).

Les objets graphiques utilisés pour encodes des valeurs quantitatives sont :

–       les points

–       les lignes

–       les barres

–       les formes en 2D

 

Les points et les lignes

 

Les points sont rarement utilisés seuls sur un graphe, à part dans les mesures de corrélation où les nuages de points sont très utilisés. Les points dans les graphes plus classiques sont souvent reliés par une ligne. Cela peut sembler redondant : la ligne donne les mêmes informations que les points, si ce n’est qu’elle représente plus facilement la tendance de la relation et de ses changements.

 

Les barres

 

Les barres sont en réalité des rectangles, mais généralement, l’information qu’elles portent n’est dépendante que de leur longueur. La largeur d’une barre dans un graphe ne sert à rien, seuls nous intéressent la base de la barre et le point auquel elle s’arrête. C’est rarement un problème en informatique où les tableurs type Excel nous interdisent de faire varier les largeurs des barres.

Les barres peuvent être présentées dans les deux directions.

Les barres pourraient être remplacées par des points : après tout un point et une barre portent la même information. Néanmoins, les barres ont un impact visuel fort qui permet facilement de montrer une valeur discrète.

Comme c’est la longueur d’une barre qui encode son information, la base de la barre doit toujours être zéro, à une exception près : quand les barres sont utilisées pour montrer des écarts entre des séries de valeurs (plus grande et plus petite valeur).

 

Les formes 2D

 

La plus connue des formes 2D est le camembert. L’auteur conseille d’abandonner l’utilisation des camemberts, car ils communiquent mal les informations. En effet, notre perception visuelle a beaucoup de problèmes avec l’association d’une valeur quantitative à une surface. Sans légende détaillée, il est difficile de savoir quelles sont les valeurs précises liées à chaque part différente du camembert. Si les surfaces sont proches, il peut même être compliqué de savoir laquelle est la plus grande.

 

Les subdivisions en catégorie peuvent être représentées en appliquant un des attributs suivants aux mêmes objets qui sont utilisés pour encoder les valeurs quantitatives :

–       la position (le long d’un axe)

–       la couleur

–       la forme du point

–       le remplissage

–       le style de ligne

 

La position

 

La position est l’attribut le plus commun pour identifier les catégories, comme sur le graphe suivant où il n’y a aucun doute sur quel mois est associé avec chacune des barres.

 

 

La couleur est sans doute l’attribut le plus utilisé après la position pour identifier des catégories. Dans le graphe suivant, la position étant déjà utilisée pour identifier le mois, il est possible d’utiliser la couleur pour montrer la différence entre les ventes directes et indirectes.

 

 

La forme des points

 

Encore un attribut qui peut nous permettre de distinguer sur un niveau supplémentaire les catégories, comme sur le graphe suivant.

 

 

Le remplissage

 

Le remplissage est à utiliser en dernier recours, car ils peuvent faire mal aux yeux. Si nous ne pouvons pas utiliser la couleur et que nous n’avons que quelques catégories différentes, on préfèrera utiliser des nuances de gris.

 

Les styles de lignes

 

De la même manière que le remplissage, utiliser des styles de lignes différents d’une ligne continue (typiquement des lignes en pointillés) est à privilégier quand l’impression couleur n’est pas possible. En effet, les lignes interrompues peuvent nuire à la perception générale du graphe.

 

Après avoir vu les éléments qui encodent les valeurs quantitatives et les catégories dans un graphe, l’auteur s’attache à nous montrer quels genres de relations peuvent être déployées dans un graphe.

Il y en a 7 :

–       la comparaison nominale

–       la série temporelle

–       le classement

–       la part d’un tout

–       la déviation

–       la distribution

–       la corrélation

 

La comparaison nominale

 

C’est la relation la plus simple de toutes : l’idée est juste de déployer un certain nombre de valeurs pour comprendre qui est la plus grande de toutes, la plus petite etc.

Le meilleur outil graphique pour la comparaison nominale sont certainement les barres, qui demandent néanmoins l’utilisation d’une échelle qui commence à zéro (l’information résidant dans la longueur de la barre par rapport aux autres). Dans le cas où les valeurs entre nos différentes catégories sont élevées mais varient peu, on peut également utiliser une échelle qui ne commence pas à zéro pour se concentrer sur la zone de données qui varie réellement. Dans ce cas on préférera l’utilisation de simples points.

 

La série temporelle

 

La série temporelle est la relation la plus utilisée en business : elle consiste à déployer une valeur quantitative en relation avec des catégories de temps : des mois, des trimestres, des années. Cette démarche permet de comprendre l’éventuelle fluctuation de ces valeurs.

La convention veut que pour représenter une série temporelle, l’axe du temps soit l’axe X, orienté de gauche à droite. Tous les objets graphiques (points, barres, lignes) sont donc utilisables sauf les barres horizontales. On peut utiliser conjointement les points reliés de lignes pour insister sur les valeurs et sur la forme générale de leur comportement.

 

Le classement

 

Dans un classement, les catégories sont séquentielles et s’enchaînent (premier, deuxième, troisième…).

Montrer un classement suppose d’avoir trié nos catégories, soit de la plus élevée à la plus faible, soit l’inverse. La convention veut que les classements soient représentés de haut en bas. Rien n’est alors plus efficaces que l’utilisation de barres horizontales.

 

La part d’un tout

 

Ces graphes montrent comment un ensemble de valeurs quantitatives liées à des catégories représente une partir d’un tout qui est l’ensemble de ces catégories. Ce graphes expriment des ratios, et leur unité de mesure est généralement le pourcentage.

La tentation est grande dans ce cas d’utiliser un camembert, mais l’auteur a déjà démontré pourquoi cet objet graphique n’est pas efficace pour représenter cette relation. Une utilisation classique de barres, verticales ou horizontales, est plus efficace, chacune étant associée avec une valeur en pourcentage du total.

 

La déviation

 

Les relations de déviation communiquent comment une série de valeurs diffère d’une valeur fixée. Cette relation s’exprime comme une différence entre la série de valeurs et la valeur de référence, soit en termes de ratios (+6%) soit en termes de différences absolues (-15 000 euros).

Une déviation par rapport à une valeur cible déployée dans le temps sera généralement illustrée par une ligne.

 

 

Une déviation combinée avec d’autres types de relations (classement, part d’un tout) utilise des barres.

 

 

La distribution

 

La distribution montre comment est répartie une série de valeurs quantitatives sur son ensemble. Par exemple : la distribution des salaires dans une entreprise. Dans ce cas il faut créer des catégories qui représentent des écarts (si possible fixes en valeurs absolues), ici moins de 15 000 euros, entre 15 001 et 30 000, …

Il y a deux types de distributions : celles qui montrent la distribution d’un seul ensemble de valeurs (fréquence) et celles qui montrent les distributions de multiples ensemble de valeurs pour qu’ils puissent être comparés.

La distribution de fréquence peut être représentée par un graphe appelé histogramme. Bien qu’il n’y ait pas de raisons de ne pas utiliser des barres horizontales, l’histogramme est devenu une convention utilisant des barres verticales. Elle peut également être représentée par une courbe, qui met l’emphase sur la forme de la distribution.

 

 

 

Pour les distributions multiples, les lignes sont également efficaces dans la limite de cinq sur le même graphe. Au-delà, on pourra utiliser les chandeliers, qui est un objet graphique très utile car il apporte beaucoup d’informations (la plus grande valeur, la plus petite, l’écart entre la plus grande valeur et la plus petite, la médiane de la distribution, et les écarts entre les 25, 50 et 75ème pourcentiles).

 

 

 

 

La corrélation

 

La corrélation montre à quel point sont liées les variations d’un ensemble de valeurs quantitatives avec un autre. Attention ! Ce n’est pas parce que deux ensembles de valeurs sont corrélés que l’un est la cause de l’autre. Par exemple, on pourra étudier la corrélation entre les dépenses marketing et le chiffre d’affaires d’une entreprise. Si la corrélation existe, rien ne prouve qu’une hausse des dépenses marketing est la cause de l’augmentation des ventes (même si intuitivement c’est certainement le cas).

Le meilleur outil graphique pour la corrélation est sans aucun doute le nuage de points, qui peut être agrémenté d’une ligne de tendance si elle existe.

 

 

Chapitre 6 : Perception visuelle et communication quantitative

 

La vision est parmi tous nos sens le canal le plus efficace pour recevoir des informations du monde extérieur. 70% de nos récepteurs sensuels sont dédiés à la vision. Il y a une véritable connexion entre ce que nous voyons, pensons et comprenons.

Les graphes et dans une moindre mesure les tableaux sont des moyens de communication visuels. En suivant certaines règles physiologiques de perception, nous pouvons présenter nos données d’une telle manière que ce qui est important ressort immédiatement.

Quels sont les mécanismes de la vue ? Pour qu’une stimulation visuelle se déroule, il faut de la lumière. Pour voir quelque chose, il faut que cette chose soit une source de lumière ou une surface qui réfléchisse la lumière. La lumière entre dans nos yeux, qui contiennent des cellules nerveuses destinées spécifiquement à absorber la lumière et à la traduire en signal neuraux. Ces signaux sont ensuite passés via le nerf optique vers le cerveau. C’est là que les images sont perçues : c’est notre cerveau qui voit, pas nos yeux. Il en résulte la perception visuelle.

Dans le cerveau, il y a trois types de mémoire :

–       la mémoire iconique (un enregistreur de notre perception visuelle)

–       la mémoire court-terme

–       la mémoire long-terme

Les signaux électriques qui viennent de fraîchement encoder ce que nous avons vu vont d’abord dans la mémoire iconique, en attendant d’être versés dans la mémoire court-terme. Cette partie de la perception est inconsciente (processus pré-attentif) contrairement à ce qui se passe plus tard dans la mémoire court-terme, où un effort conscient doit être réalisé (processus attentif).

Le processus pré-attentif est un processus très rapide qui détectent un certain nombre d’attributs qu’il faut exploiter dans la construction de nos tableaux et graphes, notamment la couleur, la forme et la position dans l’espace.

La mémoire court-terme est une mémoire de travail dans laquelle les informations peuvent rester quelques secondes ou plusieurs heures, dépendant du niveau de stimulation. La mémoire court-terme est limitée en capacité, c’est pour cette raison que nous ne sommes pas capables de retenir de nombreuses nouvelles informations d’un seul coup. C’est pour cette raison qu’il est très inefficace de présenter des graphes avec dix courbes différentes : le lecteur sera obligé de se référer de nombreuses fois à la légende pour se rappeler les correspondances entre les couleurs et les catégories. C’est aussi pour cette raison que les graphes sont bien plus efficaces que les tableaux pour présenter des relations entre des valeurs : toute l’information est encodée en un seul objet graphique.

La recherche a montré que les attributs détectés pendant le processus pré-attentif peuvent être séparés en quatre catégories :

–       la forme

–       la couleur

–       la position spatiale

–       le mouvement

 

La forme

 

 

La couleur

 

Les couleurs sont représentées par trois valeurs : teinte, saturation et brillance (le système HSB, H pour Hue qui veut dire Teinte en anglais). La teinte représente le degré de rotation sur la roue des couleurs.

 

 

La saturation et la brillance sont exprimées en pourcentage.

 

La position spatiale et le mouvement

 

Ce sont deux catégories d’attributs très efficaces à utiliser dans les graphes. Par exemple quand la course d’un objet en mouvement change soudainement.

Pour encoder des valeurs quantitatives, nous pouvons utiliser les attributs de forme comme la longueur de ligne, et dans une moindre mesure la largeur de ligne et la taille des objets ; également de manière limitée un attribut de couleur comme l’intensité ; ou encore l’attribut de position.

La perception pré-attentive a ses limites, notamment quand le nombre d’attributs différents augmente. Dit autrement, il est plus facile de distinguer un aigle dans un ciel rempli de pigeons que dans un ciel rempli d’oiseaux de nombreuses espèces. Pour le même attribut, le nombre maximum conseillé de distinctions est quatre.

Une autre limitation à prendre en compte est qu’il est très difficile de gérer deux attributs, ou plus, différents en même temps. C’est ce que montrent les deux figures suivantes, où il faut être bien plus attentif pour percevoir les différences de forme et de couleur sur le second schéma, par rapport au premier où les seules différences sont de couleur.

 

 

Un même attribut peut devenir inefficace si sa déclinaison est exagérée : imaginons 20 courbes sur un graphe, il deviendra très difficile de les discerner, notamment les courbes orange, orange foncé, rouge et marron. La recherche a montré que nous pouvons utiliser sans nuire au processus pré-attentif jusqu’à 12 couleurs. Déclinées en version saturée et insaturée, cela peut nous donner de nombreuses possibilités de couleurs à utiliser sur un graphe.

Il faudra faire attention aux significations culturelles de certaines couleurs (le rouge par exemple).

 

Chapitre 7 : Design général pour la communication

 

Notre compréhension de la perception visuelle va nous permettre de bâtir un certain nombre de principes. L’objectif primaire de la communication visuelle est de mettre en valeur ce qui est important. Dans un second temps, il faudra réussir à ordonner les données pour permettre au lecteur de parcourir nos messages d’une manière optimale.

L’auteur introduit un concept appelé le ratio encre – données. Ce ratio se calcule en faisant le rapport entre la quantité d’encre utilisée pour montrer les données et la quantité totale d’encre sur notre graphe ou tableau. L’objectif est bien sûr de maximiser ce ratio pour permettre au lecteur d’avoir un accès direct à l’information.

L’idée n’est pas d’éliminer toute l’encre utilisée en support des données, parce que nous aurons toujours besoin d’explications sur nos graphes pour aider le lecteur. L’idée est de réduire cette encre au maximum sans mettre en jeu la lisibilité de notre graphe.

Pour augmenter ce ratio, nous avons le choix entre réduire l’encre en support des données ou d’augmenter l’encre destinée à présenter les données.

La première option suggère de se poser la question, lors de la construction de notre graphe, si telle ou telle partie du graphe en support des données peut être enlevée sans nuire à la compréhension. Comme le disait Saint-Exupéry, la perfection est atteinte non pas quand il n’y a plus rien à ajouter, mais plutôt quand il n’y a plus rien à enlever. Après tout, le terme « élégance » vient du latin « eligere » qui veut dire « choisir avec attention ». Pour arriver à notre objectif de réduire l’encre de support des données, on fera bien attention à ce que toute cette encre soit à l’arrière-plan : le focus graphique doit se concentrer sur les données, pas sur le support. Cela suppose par exemple de bien choisir son fond de graphe (généralement une couleur la plus neutre possible).

Pour répondre à la seconde option, nous avons le choix entre enlever toute l’encre de données inutile (trop en dire va nuire à notre message), et mettre l’emphase sur la plus importante encre de données (en utilisant les attributs de perception pré-attentive comme la largeur de ligne, l’orientation, la taille, la couleur et son intensité…).

Organiser les données suggère que nous fassions tout pour que les données soient présentées dans un ordre qui favorise la clarté de notre message. La communication implique plus que de savoir quoi dire : cela implique également de savoir comment le dire.

Notre message va peut-être demander l’utilisation de nombreux graphes. Dans ce cas, nous devons raconter une histoire : quelles données, quel message doit venir en premier ? Et ensuite ? Et pour la fin ?

C’est également notre tâche de prioriser les données en faisant en sorte que les données les plus utiles soient remarquées en premier. Dans un tableau, on pourra utiliser le gras, des lignes plus épaisses, le fond d’une case d’une couleur différente, ou le positionnement d’une case en haut ou en bas. Dans un graphe, on utilisera des lignes plus épaisses et également des couleurs différenciantes. Il faut se servir du principe de contraste : un objet va sortir du lot si tous les objets sont pareils sauf celui-ci.

Si notre lecteur doit parcourir une série de tableaux ou de graphes pour saisir notre message, le positionnement de ces éléments sur la page doit répondre à la convention gauche-droite haut-bas. Numéroter les éléments est également intéressant pour donner un fil conducteur au lecteur.

Pour terminer ce chapitre, Stephen Few explique que du texte peut être facilement utilisé pour communiquer des informations quantitatives en accompagnement de notre graphe ou de notre tableau.

Le rôle du texte remplir huit fonctions différentes :

–       titrer (des titres clairs sont souvent vitaux pour permettre la bonne interprétation d’un tableau ou d’un graphe)

–       introduire (très utiles en amont d’un rapport assez long, ou pour des nouveaux lecteurs d’un vieux rapport, permettant ainsi de gagner beaucoup de temps grâce à tous les éléments de contexte)

–       expliquer (si un peu de texte est tout ce qu’il faut pour rendre un graphe clair, alors il ne faut pas hésiter)

–       renforcer (répéter un message visuel avec un peu de texte permet d’augmenter nos chances que le message soit perçu)

–       mettre en valeur (une alternative ou un complément à tous les attributs de perception pré-attentive vus plus hauts)

–       séquencer (quelques numéros bien placés au sein d’un rapport aident le lecteur)

–       recommander (recommander au lecteur de passer à l’action après lui avoir présenté une information sur un graphe ou un tableau est plus efficace par texte)

–       enquêter (sous la pression du business, nous avons parfois du mal à se demander pourquoi les choses sont comme elles sont).

Le meilleur endroit pour placer un texte est tout simplement aussi près que possible de l’endroit où on en a besoin. En effet, nos yeux n’ont qu’une zone restreinte sur laquelle ils peuvent se concentrer. Si par exemple nous plaçons une légende trop loin des courbes qu’elle est censée commenter, nous forçons le lecteur à faire des aller-retours visuels. Si notre commentaire est très long, il ne faut pas hésiter à reproduire dans notre rapport le même graphe plusieurs fois.

 

Chapitre 8 : Design des tableaux

 

Une fois que nous avons déterminé que le tableau est l’élément qui va le mieux communiquer notre message, nous devons travailler à rendre ce tableau immédiatement compréhensible par nos lecteurs. C’est l’objet de ce chapitre.

Les composants structurels d’un tableau sont les composants de données, et les composants de support. Quand ces composants sont bien designés, le résultat est clair et la communication effective.

Dans un tableau, les composants de données sont du texte (des nombres ou des mots). Souvent, du texte additionnel permet d’améliorer l’efficacité des tableaux comme vu au chapitre précédent pour titrer, introduire, expliquer, renforcer, mettre en valeur, séquencer, recommander ou enquêter. Les plus courants sont les titres et les titres des colonnes et lignes.

Parmi les composants de support, on compte les espaces vides, les lignes ou les grilles et la couleur de remplissage. Utilisés avec intelligence, les espaces vides organisent les données sans attirer l’attention sur la méthode employée pour les organiser, contrairement aux grilles ou aux couleurs de remplissage.

Les meilleures pratiques de design de tableaux peuvent se résumer en cinq catégories :

–       délimiter les colonnes et les lignes

–       arranger les données

–       formater le texte

–       résumer les données

–       répéter les informations.

 

Délimiter les colonnes et les lignes

 

Les espaces vides sont le moyen à préférer pour séparer les données en colonnes et en lignes.

 

 

Plus les lignes sont longues, plus les espaces vides doivent être importants pour être capables de faire la différence entre chaque colonne. Niveau lisibilité des colonnes, l’auteur conseille de consacrer une hauteur d’espace vide égale à la hauteur de nos données, comme sur l’exemple ci-dessus. Quoi qu’il en soit, les espaces vides peuvent être manipulés pour diriger les yeux de nos lecteurs. Si nous voulons que nos lecteurs parcourent le tableau de haut en bas, il faut augmenter l’espace entre les colonnes. Pour un parcours de gauche à droite, le long des lignes, nous pouvons augmenter l’espace vide entre les lignes.

Du côté des lignes et des grilles, on reconnaîtra leur efficacité à délimiter les lignes et les colonnes, à grouper les données en sous-groupes et à mettre en valeur certains de ces sous-groupes. Malheureusement, les lignes et les grilles sont des distractions pour l’œil et isolent chaque cellule l’une de l’autre.

Qu’est-ce qui est le plus clair : le premier ou le second tableau ?

 

 

 

Même une délimitation de notre tableau par un encadré est une perte d’encre, excepté quand nous devons placer d’autres objets sur la page.

Quand les espaces vides seuls ne peuvent pas être utilisés pour délimiter de manière effective les colonnes et les lignes, l’utilisation d’une couleur de remplissage (une légère touche de gris par exemple) fonctionne bien mieux que des lignes ou des grilles. Malheureusement, le remplissage limite à une seule dimension la lecture d’un tableau, comme présenté ici.

 

 

 

Une couleur de remplissage peut aussi être utilisée pour mettre en valeur certaines données.

 

 

Arranger les données

 

Les subdivisions de catégories peuvent être organisées soit en colonne soit en ligne. Mais certains arrangements fonctionnent mieux que d’autres. Stephen Few suggère de se poser quelques questions à la construction d’un tableau :

–       Combien de subdivisions va-t-il contenir ?

–       Quel est le nombre maximum de caractères dans une subdivision ?

–       Est-ce que les subdivisions sont des séries de temps ou des classements ?

Si nous avons peu de subdivisions, nous pouvons les placer en colonnes, comme les régions de ventes sur le tableau suivant :

 

 

Mettre les produits en colonne et les régions de ventes en ligne apparaît comme une option moins intéressante, pour des raisons d’espace sur la page. Ce tableau est bidirectionnel : une première série de catégorie est présenté en colonnes (les régions de vente) et la seconde série (les produits) en ligne. Un tableau unidirectionnel pourrait ressembler à ça :

 

 

Le problème est que la forme de ce tableau rend plus difficile les comparaisons des ventes du même produit dans des régions différentes.

Un grand nombre de caractères dans les subdivisions peut nous amener à changer notre fusil d’épaule et à déployer les catégories en ligne, sous peine de devoir prendre un large espace pour faire tenir le libellé de la colonne sur la page.

Enfin, si nos catégories impliquent une échelle de temps, la convention veut que ces catégories soient présentées de gauche à droite en colonne. A l’inverse, un classement sera présenté verticalement, en lignes de bas en haut.

L’ordre de nos colonnes est également important, surtout quand certaines de ces colonnes dérivent d’un calcul de chiffres présents dans le tableau. La convention de lecture occidentale étant de gauche à droite, on veillera à ce que les colonnes calculées apparaissent directement à droite des colonnes desquelles elles dérivent. Pour les libellés de chaque colonne et de chaque ligne, la convention est bien sûr de les placer en haut et à gauche du tableau, comme sur l’exemple suivant :

 

 

Enfin, des colonnes contenant des valeurs pour lesquelles nous souhaitons que nos lecteurs fassent de nombreuses comparaisons doivent être placées les unes à côté des autres, si possible.

Au niveau de l’arrangement des données, il semble naturel de trier les dates par ordre chronologique par exemple. Il faut surtout prendre garde à trier les données pour qu’elles gardent leur sens en termes de business. Par exemple, si nous faisons du business dans cinq pays, dont 80% en France, il est logique de placer la France en tête dans notre tableau et de ne pas tenir compte d’un éventuel ordre alphabétique.

 

Formater le texte

 

Il n’y a pas de raison valide, dans un tableau, pour changer l’orientation du texte. C’est différent pour un graphe, parfois.

Concernant l’alignement du texte, il existe un certain nombres de conventions qu’il faut respecter :

–       Les nombres qui représentent des valeurs quantitatives doivent toujours être alignés à droite

–       Les dates sont alignées à gauche, dans un format qui garde le nombre de caractères constant quelle que soit la date (par exemple dd-mm-yy).

–       Les textes qui n’expriment ni des nombres ni des dates sont à aligner à gauche.

Quand nous sommes amenés à traiter des nombres avec des décimales, une bonne technique pour garder l’alignement est de garder la précision constante sur toutes les valeurs (par exemple deux chiffres après la virgule).

A noter que les titres des colonnes sont alignés avec leur contenu : c’est intentionnel et agit comme un repère visuel pour le lecteur, comme sur le tableau suivant :

 

 

L’idée est toujours d’être suffisamment précis dans nos données, sans en faire trop. Si l’objectif de notre tableau est de communiquer des calculs financiers, cela a du sens d’aller jusqu’au centime. Par contre, si nous présentons une comparaison pluri-annuelle des ventes d’une grande entreprise, exprimer les nombres en millions d’euros est intéressant pour gagner de la place dans les tableaux.

Bien sûr les polices de caractère utilisées doivent être parmi les plus lisibles, et la mise en gras ou en italique ou en couleur ne doit être réservée qu’aux valeurs que nous souhaitons voir ressortir.

 

Résumer les données

 

Ici l’auteur traite le sujet des fameuses colonnes ou lignes « Total ». Il est courant de les placer en bas ou à droite de nos tableaux, et de les mettre en gras pour qu’elles soient bien mises en valeur.

Ce placement en bas ou à droite est un usage courant, pourtant il peut être intéressant pour le lecteur de disposer de ces informations en introduction même du tableau, comme sur l’exemple suivant :

 

 

Répéter les informations

 

Quand nous déployons des tableaux longs de plusieurs pages, il faut penser à nos lecteurs et replacer en tête de chaque page les libellés de chaque colonne.

 

Chapitre 9 : Design général de graphes

 

La nature visuelle forte des graphes demande de suivre un certain nombre de bonnes pratiques, conditions sine qua none pour profiter du pouvoir incroyable des graphes à communiquer des relations quantitatives complexes.

« Par-dessus tout, montrer les données ». Cette phrase d’Edward R. Tufte, un pionnier du design des graphes dans les années 80, est un moto à suivre dans tous les cas. Cela suppose, par exemple, d’encoder les quantités avec des échelles de valeurs qui nous permettent de les juger objectivement et d’éviter l’usage de la 3D.

En effet, il est facile de faire mentir un graphe en suivant quelques règles de base, comme par exemple sur les graphes suivants :

 

 

Ici les mêmes sonnées sont encodées graphiquement de deux manières diamétralement opposées.

En d’autres termes, on peut faire dire n’importe quoi à un graphe. C’est clairement de la manipulation, que l’auteur décourage, car pour lui le but du design au service de la communication est de présenter précisément la vérité.

Cela suppose d’abord d’inclure la valeur zéro sur notre échelle et que les distances entre chaque marque sur cette échelle correspondent à la différence des valeurs qu’elles représentent. Exclure la valeur zéro de notre graphe peut se justifier si nous souhaitons faire un focus précis sur le comportement des valeurs. Dans ce cas, il est juste de prévenir le lecteur, comme sur le graphe suivant :

 

 

Enfin la 3D doit être bannie car elle nuit complètement à la lisibilité des graphes. Il y a toujours une solution en 2D pour exprimer clairement des relations quantitatives.

 

 

Chapitre 10 : Design des composants d’un graphe

 

Un certain nombre de composants visuels et textuels doivent travailler ensemble dans un graphe pour communiquer de l’information quantitative. Le message peut en souffrir s’ils sont mal utilisés.

Il y a les composants de données : points, barres, lignes, lignes d’échelle, légendes.

Et il y a les composants de support : les axes, la région de données, et les lignes de grilles.

 

Les composants de données

 

Au niveau des points, les tailles, formes et couleurs différentes sont les trois seuls attributs que nous pouvons utiliser pour les différencier. Il n’y a bien sûr aucune règle qui nous empêche de combiner ces attributs pour renforcer cette différenciation :

 

 

Quand les points se recouvrent et qu’il n’est pas possible d’agrandir notre graphe ou de réduire la taille de nos points, enlever les couleurs de remplissage est une excellente technique, comme sur le graphe suivant :

 

 

Parfois, en compléments de lignes, nous utilisons les points pour insister sur certaines valeurs. Dans ce cas, il convient de choisir une forme de point qui ressorte clairement vis-à-vis de la ligne.

 

 

Concernant les barres, il existe cinq attributs sur lesquels nous pouvons jouer : l’orientation, la proximité, le remplissage, le contour, la base.

Une orientation horizontale est idéale quand le graphe présente une relation de classement ou si les catégories présentant les barres ne tiennent pas les unes à côté des autres sur un plan horizontal.

 

 

Les conventions de proximité des barres veulent que l’espace vide entre chaque barre soit compris entre 50 et 150% de la largeur de la barre. Un espace vide entre chaque barre est à abandonner quand les barres appartiennent à une même catégorie et qu’elles ont déjà été différenciées par une couleur de remplissage.

Le remplissage des barres demande d’utiliser des couleurs bien distinctes et d’éviter les remplissages de forme (diagonales, petits symboles…) qui peuvent être déroutants pour la vision. Les couleurs de remplissage doivent être équilibrées si nos jeux de données sont d’importance égale. A l’inverse une couleur forte peut être utilisée pour faire ressortir une barre en particulier.

Ajouter une bordure à une barre, c’est ajouter un élément visuel sans ajouter d’information. Stephen Few conseille donc de n’utiliser des bordures que si les barres ont du mal à ressortir (par exemple une bordure bleue sur une barre jaune sur un fond blanc). Comme les couleurs, une bordure peut être utilisée pour faire ressortir une barre particulière.

Concernant les bases des barres, il faut bien sûr toujours qu’elles commencent à zéro car c’est la longueur de la barre qui encode sa valeur quantitative. A une exception : quand la barre est utilisée pour présenter un écart de valeur.

Au niveau des lignes, il en existe de quatre types sur un graphe :

–       les lignes standard

–       les lignes haut-bas

–       les lignes de tendance

–       les lignes de référence

Les lignes standard encodent des valeurs individuelles qui évoluent. La façon la plus efficace de les distinguer est de faire varier leur teinte ou leur intensité. On peut en dernier recours utiliser des lignes avec différents types de pointillés, mais le résultat n’est pas terrible pour les yeux.

Les lignes haut-bas représentent les maximum et minimum de valeurs quantitatives à travers de nombreux jeux de données sur une échelle de catégorie.

 

 

On peut également représenter le haut-bas par une série de chandeliers, reliés ou nom par une ligne moyenne.

 

 

Les lignes de tendance montre le mouvement général de valeurs quantitatives le long d’une série de divisions de catégories.

 

 

Elles sont également un outil très utile sur les nuages de points, pour montrer ce qui serait difficile à voir autrement.

 

 

Les lignes de référence sont utilisées pour permettre une comparaison facile d’une ligne standard à, par exemple, une moyenne constatée.

Les lignes d’échelle sont intimement liées aux axes, avec qui elles se confondent généralement. Une échelle quantitative procure un moyen d’assigner des valeurs quantitatives à un objet graphique chargé d’encoder ces valeurs, à partir du positionnement de l’objet par rapport à cette échelle. Une échelle de catégorie réalise la même chose : assigner une catégorie à un objet graphique.

Sur ces lignes d’échelle, il y a des coches, qui établissent la position des valeurs. L’auteur conseille de rendre les coches juste visibles : suffisamment pour être vues sans nuire à l’objet graphique présenté sur le graphe. Il préfère placer les coches à l’extérieur de la ligne d’échelle, pour ne pas empiéter sur la zone de données. Il conseille même de supprimer les coches sur les échelles de catégorie, comme sur l’exemple suivant :

 

 

Il n’y a pas de véritable règle sur le nombre de coches que nous pouvons inclure dans un graphe : il faut juste viser un nombre qui évite l’encombrement sur le graphe mais qui permette au lecteur de déterminer facilement les valeurs encodées.

A propos des légendes, Stephen Few suggère de les utiliser surtout quand il n’est pas possible de donner un titre directement à chaque objet du graphe. Sur l’exemple suivant, nous pouvons donner un titre à chaque ligne : une légende est donc inutile.

 

 

Si on utilise une légende, il convient de la placer le plus près possible des objets qu’elle décrit. Comme les coches sur les échelles, il est préférable de rendre la légende suffisamment voyante sans pour autant prendre le dessus sur l’objet graphique. Un cadre autour de la légende est nécessaire seulement si on doit la séparer d’autres informations.

 

Les composants de support

 

Les seuls composants dans les graphes qui renforce la structure visuelle sans représenter l’information sont les axes et la zone définie par les axes où l’objet graphique est déployé.

Un axe vertical et un axe horizontal sont suffisants. En effet, deux lignes perpendiculaires suffisent pour tracer un cadre virtuel qui sera perçu naturellement par le lecteur. Un cadre autour de la zone des données n’est seulement utile que pour isoler l’objet graphique et le mettre en valeur.

La ratio entre la hauteur et la largeur d’un graphe ne répond à aucune convention. Néanmoins, il est préférable de ne pas manipuler ce ratio pour tromper le lecteur sur la forme véritable d’une courbe, par exemple. De même, un graphe est généralement plus large que haut.

Au niveau de la zone de données, Stephen Few conseille de se limiter à un fond blanc ou à la rigueur coloré avec une intensité très faible.

Enfin, les lignes de grilles sont un excellent outil pour faciliter les comparaisons de valeur.

 

Chapitre 11 : Solutions de design pour des variables multiples

 

Souvent le message que nous avons besoin de communiquer implique plus qu’une variable quantitative que nous devons mettre en relation à quelques catégories.

Il est bien sûr facile de combiner plusieurs jeux de données quantitatives sur le même graphe si ces données s’expriment dans la même unité. Par exemple, un seul graphe pourra contenir l’évolution dans le temps de notre chiffre d’affaires, de notre bénéfice et de nos dépenses. Quand les unités de mesure pour les jeux de données sont différentes, on peut créer plusieurs graphes et les placer les uns à côté des autres. Avec seulement deux jeux de données, on peut rassembler les objets graphiques sur le même graphe, avec deux axes verticaux et des échelles différentes, comme ici :

 

 

Au-delà de deux jeux de données, il devient compliquer de tout présenter au sein d’un même graphe. Dans ce cas, il faut combiner de nombreux graphes en une série, une sorte de super-graphes.

 

 

A mesure que le nombre de graphes augmente, l’idée est de réduire leur taille individuelle pour leur permettre de tous tenir sur une page.

Les graphes du super-graphes doivent respecter les principes de cohérence (le même design pour tous les graphes) et d’arrangement (arrangement horizontal pour les comparaisons de catégorie, arrangement vertical pour les comparaisons de valeur, ou arrangement en matrice si le nombre de graphes est trop élevé).

 

Chapitre 12 : La réciproque entre les standards et l’innovation

 

Ce chapitre fait office de conclusion de la part de l’auteur. Il explique qu’il est toujours surpris par le fait que nous perdons du temps à reprendre sans cesse les mêmes décisions parce que nous ne prenons pas le temps de regarder ce qui fonctionne et d’en construire un standard à suivre.

C’est la même chose en design de tableaux ou de graphes : les principes montrés dans ce livre doivent servir à énoncer des standards de communication au sein de l’entreprise, pour réserver notre puissance intellectuelle à des tâches bien plus excitantes et demandeuses.

Suivre un standard nous fait gagner du temps mais en fait gagner à nos lecteurs.

 

Mon avis sur le livre :

 

Show me the Numbers est un livre qui m’aura demandé beaucoup d’efforts de résumé car il a vraiment abordé un sujet qui ne me paraît pas simple. Plus que ça, avant d’ouvrir ce livre je n’avais même jamais songé à l’existence de standards de design au service de la communication des chiffres. Quand j’avais besoin d’un graphe, je lançais les quelques fonctions automatiques disponibles dans Excel et je prenais le résultat tel quel.

Quelques heures avant de terminer ce résumé, j’ai assisté à une réunion assez importante du management de la société dans laquelle je travaille devant tous les employés. De nombreux tableaux ont été présentés, remplis de chiffres. Et je me suis souvent dit : « Un bon graphe bien clair suffirait à faire passer le message, plutôt que cet amas de cellules illisibles ».

Je conseille donc Show me the Numbers à tous ceux qui produisent des rapports, des tableaux et des graphes dans leur travail quotidien, sans pour autant être business analyst ou directeur général, pour faire gagner du temps, à eux et aux autres.