Qu’est-ce que le Data journalisme ? L’espoir de toute une profession ?

Big data, data analyst, data design, data visualization, data journalism … Une multitude de mots, mais toujours la même rengaine : « data ». Ce mot n’est pas anodin, la donnée est réellement le « nouveau pétrole du XXIème siècle ».

Pourtant, l’utilisation de chiffres par les journalistes n’a rien d’inédit. Dans les années 60, on appelait cette méthode le « journalisme assisté par ordinateur » (JAO) ou « computer-assisted reporting ». L’apparition des ordinateurs poussera la profession à se moderniser.

En fait, le « data journalisme » nait d’un désir « d’objectivité ». Ce mot provient du latin datum, désignant un élément utilisé au sein d’une argumentation, d’un propos. Ainsi une donnée « ne peut être réfutée, elle est, simplement ».[1] Le data journalisme représente, alors, une véritable valeur ajoutée pour le monde journalistique, surtout en cette période de crise où la profession souffre d’un manque de légitimité et subit l’avènement d’une nouvelle concurrence qui oblige les journaux à une course à la rentabilité.

Alors que le journal a dû faire face à l’apparition de la radio, elle-même affaiblie par l’avènement de la télévision, une profession tout entière doit faire bloc face à la naissance de « pseudo-journalistes » sur Twitter, Facebook ou encore Instagram. Aujourd’hui, le journalisme est menacé par l’avancée technologique des réseaux sociaux, participant au discrédit du monde journalistique. Pourquoi ne pas se servir de la source de son mal, à savoir la technologie, comme arme pour lutter contre la crise ? C’est la volonté du data journalisme ou journalisme de données : cette technique vise à utiliser les données non plus comme une simple illustration à un argumentaire mais comme le véritable point de départ d’un travail. Le data journaliste a cette mission de rendre intelligibles des données abstraites dans un format attractif, de « rendre visible l’invisible. »[2]

Qu’est-ce que le data journalisme et quels sont ses enjeux ? Quel avenir réserve-t-il au monde journalistique ?

Pour répondre à cette vaste interrogation, nous avons eu la chance de rencontrer deux femmes ancrées dans le monde des données. Tableaux Excel, codage, recodage, base de données… Plus rien ne les effraie. Tout d’abord, Caroline Goulard est une ancienne sciencespiste rennaise qui a fondé, avec deux de ses amis, la plateforme d’informations Dataveyes. Cette société de services, née en 2010, est centrée sur les « interactions Humains-Données » (C. Goulard) et la visualisation de données. Ensuite, Karen Bastien est journaliste depuis une vingtaine d’années. Elle a travaillé six ans au journal Libération puis, en 2006, elle fonde Terra Nova, un média axé sur les sujets écologiques. Au cours de ces deux expériences, elle réalise l’importance des données mais aussi les carences d’un journaliste traditionnel dans ce domaine… elle décide donc de s’auto-former et co-fonde en 2011, avec François Prosper, l’agence WeDoData, dédiée au data journalisme.

Pour comprendre ce qu’est le data journalisme, il faut d’abord le différencier de la data visualisation. Sur ce point, Caroline Goulard explique qu’il « existe deux phases primordiales dans le data journalisme. Tout d’abord, la collecte de données. Le choix du « terrain » que l’on va utiliser, aller chercher l’information intéressante dans les bases de données.  Et restituer cette « matière première » pour la donner à voir au public. Et dans cette phase de restitution, ce qui est captivant, c’est que nous avons la possibilité d’en faire autre chose que des mots. On peut travailler cette matière première pour la rendre accessible au public. En plus de l’analyse proposée par les data journalistes, les interfaces de visualisation de données interactives sont un des outils à disposition des data journalistes pour communiquer leurs analyses, et rendre les données compréhensibles par le public. Personne n’irait chercher des informations au sein d’un tableur Excel de 10 millions de lignes, quand bien même la donnée l’intéresserait. C’est donc à ce moment précis que la visualisation de données intervient comme un moyen de donner au public la capacité de chercher dans une base de données l’information qui l’intéresse, sans l’exposer directement aux données « brutes ». »Dans l’ouvrage collectif Journalisme 2.0, Caroline Goulard parle d’une posture « active » attribuée au lecteur. Lui-même prend part à la restitution de l’information, il devient acteur de l’article tout en restant le lecteur.

À première vue, le journalisme de données semble alors mettre fin à l’aspect rédactionnel de la profession. Toutefois, ce n’est pas le cas pour Caroline Goulard : « L’essence même du data journalisme est de partir d’une base de données comme point de départ. A partir de celle-ci, le but est d’en faire un article pertinent et utile. Il peut très bien se présenter sous forme de texte, avec des données glissées à l’intérieur. Tant que le « terrain » premier est celui des data. Cependant, à mon sens, il serait bien dommage de limiter le journalisme de données à une pratique basée uniquement sur les mots. D’ailleurs, la raison pour laquelle le journalisme de données a été perçu comme « novateur » dans le courant des années 2000, c’est justement parce qu’il délivre une capacité d’informations beaucoup plus grande que ce que ne permettent les mots. On a la capacité d’avoir accès à l’ensemble de la base de données, sous forme de contenu interactif, et pas seulement les chiffres qu’un journaliste aurait choisi de citer, de manière subjective. »

Pour Karen Bastien, le discours est le même que celui de la co-fondatrice de Dataveyes. Il existe diverses manières de rendre compte d’un travail data journalistique. « Il peut s’agir d’un article sous forme de texte avec des graphiques insérés. Mais cela peut être un objet plus ambitieux dans lequel se trouve un vrai travail de développement comme par exemple un mini-site ou une appli’. C’est pour cela que les développeurs sont essentiels pour trouver l’aspect le plus interactif de notre travail. Mais aujourd’hui, si l’on regarde les productions de Check news, des Décodeurs du Monde, on va tout de même avoir des articles, certes moins longs, mais quand même présents. Le texte reste nécessaire à contextualiser les données. »

À travers les témoignages de Karen Bastien et Caroline Goulard, nous comprenons également l’importance du travail en équipe dans ce monde du data journalisme, un fait novateur dans le monde des médias. Les journalistes classiques avaient plutôt l’habitude de se retrouver seuls, face à leur écran pixellisé.

De plus, Caroline Goulard insiste sur les bienfaits du data journalisme. Un article de ce type n’est pas uniquement un spectacle pour les yeux, il est aussi bénéfique pour le cerveau humain. En effet, les recherches scientifiques démontrent qu’il retiendrait mieux les informations délivrées par une image que par un amas de mots. « Le data journalisme s’intéresse à notre intelligence visuelle plus qu’à notre intelligence verbale. Mais néanmoins, tout cela ne suffit pas. Si l’on ne met pas l’enrobage d’analyse nécessaire, on rate une partie de notre travail ! »

Open Data et données « sauvages » : existe-t-il des limites au data journalisme ?

Les données que l’on peut appeler « sauvages », sont celles se situant hors de l’Open data. Alors, qu’est-ce que l’Open Data ? Comme le rappelle Caroline Goulard, les données disponibles en « open data » impliquent qu’elles soient à la disposition de tous. Elles sont publiées par des institutions publiques ou privées et sont partagées dans le but d’être réutilisées. Ainsi, ces données sont disponibles dans des formats ouverts (tableurs ou bases de données). Elles sont accompagnées d’une licence qui encadre la manière dont on a le droit de les utiliser. Par exemple, au niveau national en France, le gouvernement a lancé en 2011 la plateforme « data.gouv.fr » qui permet d’avoir accès à des données publiques.

Or, comme dans le journalisme traditionnel d’investigation, il existe dans le monde des data des informations non disponibles et non visualisables par le « Grand Public ». Des sortes de données « sauvages » que le journaliste doit se procurer à sa manière, souvent non conventionnelle ! « Un journaliste peut considérer qu’il existe des raisons supérieures, d’intérêt général, qui permettent de faire une entorse à la propriété privée ou au respect des intérêts. Les lanceurs d’alerte s’appuient sur ces mêmes raisons lorsqu’ils dévoilent des données jusque-là confidentielles, comme l’a fait Julian Assange avec les Wikileaks. », nous dit Caroline Goulard. « Ainsi, des data journalistes peuvent employer des moyens « peu formels », comme ceux qui ont participé aux Panama Papers, car ils décrètent que des phénomènes méritent d’être révélés. C’est à ce moment précis que le rôle du data journaliste est essentiel. Un long travail documentaire débute pour « nettoyer », « confronter » les données et les rendre enfin exploitables, ce qu’un journaliste traditionnel ne peut faire. »

Cependant, il existe d’autres méthodes plus conventionnelles pour se procurer des données absentes de l’Open Data. Karen Bastien parle par exemple du crowdsourcing. Le lecteur, en plus d’être « actif » lors de la lecture d’un article de data journalisme, participe également à la production de l’article même. La fondatrice de WeDoData donne l’exemple du projet « Radar », lancé par son agence. L’objectif est de récolter, au cours des six ans du mandat des maires de cinq villes de France, les informations pertinentes de chaque conseil municipal. Il s’agit d’extraire les données intéressantes de ces délibérations, noyées dans des « tonnes » de PDF. La « communauté de lecteurs » prenant part au projet est chargée de remplir un formulaire. Or, en réalisant cette tâche, chaque lecteur participe à la création et l’entretien d’un tableur Excel qui sera ensuite analysable par les data journalistes.

Malgré les espoirs que suscite le data journalisme, on semble remarquer un certain « retard Français », en comparaison à l’avancée immense des données dans le monde journalistique anglo-saxon, un propos que Karen Bastien souhaiterait « tout de même nuancer […]. Il y a dix ans, il n’y avait rien : pas de compétences pour le maniement des data dans les rédactions, pas de journaliste de données non plus. Aujourd’hui, il n’y a pas une rédaction qui ne possède pas une cellule de data journalisme. [NDLR : Notons d’ailleurs que depuis 2019, le CFJ (Centre de Formation des Journalistes) et Sciences Po proposent un master formant au « journalisme de données et d’enquête ».] Par contre, il est clair que, comparativement aux anglo-saxons, nous ne pouvons pas parler d’une « déferlante » de data journalistes… Il doit y en avoir une quarantaine en France… Je pense que les explications sont multiples, notamment culturelles. La France, c’est Albert Londres, les grands récits littéraires, les grands reportages, et pas réellement un journalisme de « facts », à l’inverse des pays anglo-saxons. D’ailleurs, ce n’est pas un hasard si nous avons importé le mot « fact-cheking » en France… Enfin, n’oublions pas la crise qui touche l’ensemble du monde journalistique et qui, elle, est une raison fondamentale de notre retard. »

Finalement, nous ne pouvons nier l’apport précieux du data journalisme pour le monde des médias. Il permet de réaffirmer les qualités du journalisme, certes traditionnelles, mais souvent mises de côté par des journalistes souffrant d’un discrédit actuel. Mais les data permettent également de moderniser la manière de s’approprier « l’info », point essentiel pour éviter « l’infox ». Cependant, si les données offrent un espoir pour pallier la crise actuelle du journalisme, il faudra parvenir à résoudre la difficile équation que nécessite la transformation du modèle économique des médias.

Crédits image : Dataveyes | About et Karen Bastien • La République des Rédacs (rredacs.com)


[1] KAYSER-BRIL, Nicolas. Informer avec des données structurées, NKB. 11 mai 2016. Disponible sur : https://blog.nkb.fr/informer-avec-des-donnees-structurees/

[2] GOULARD, Caroline. « Transformation de notre paysage informationnel et journalisme de données », in LE CHAMPION, Rémy (dir.), Journalisme 2.0, Paris : La Documentation française. 2012. p.89-99.