Je vais vous faire une confidence: je n’aime pas les chiffres. Prenez un paysage, les chiffres ressemblent aux pierres : ils sont secs, durs alors que les mots me paraissent bien plus vivants. C’est une erreur je le sais. Et DataNews est ma thérapie. Ici nous allons essayer de jouer, d’informer, de surprendre tout ça avec des chiffres. Nous traiterons de l’actu data pour la décrypter et aussi du datajournalisme qui en est l’un des aspects.
Mi data es su data On a de la chance : les chiffres sont à la mode. Et plus largement, on peut dire que les data ont la cote en ce moment. C’est un sujet qui anime une grande partie de la communauté active du web : chercheurs, journalistes, développeurs, citoyens, entreprises, tous dans un élan de gourmandise presque insatiable en réclament toujours plus. Les uns veulent plus de transparence, les autres plus d’émulation créatrice et ce lobbying d’intérêts convergents a permis d’obtenir une première grande victoire en mai 2009 lorsque le site data.gov a été lancé à l’initiative de l’administration Obama. Ce portail des données publiques américaines recense et diffuse des milliers d’informations. Avec data.gov.uk , les anglais leur ont emboîté le pas avec le soutien du Webgourou Tim Berners Lee. Et maintenant ce sont les villes françaises qui, une par une, libèrent désormais leurs informations : Rennes hier, Paris aujourd’hui, Nantes demain peut être l’État avec le projet Etalab.
Le site DataNews
Notre partenaire Data Publica
Un Médialab dans la galaxie data Mais l’ouverture des données n’est qu’une partie du mouvement qui anime la “data communauté” : d’autres thèmes, d’autres problèmes gravitent parmi lesquels le websémantique, les places de marché de données (datamarket, infochimps, Data Publica etc…), les visualisations de données ou encore le datajournalisme.
Ces deux derniers aspects nous concernent particulièrement. Outre l’actu data, nous essaieront sur DataNews de parler de ces récents sujets et par la même occasion de les pratiquer. C’est la raison pour laquelle DataNews est aussi un médialab : autour de cette plateforme, nous ouvrirons le plus largement possible aux collaborations avec tous ceux qui voudront faire parler les données. Un autre espace restera ouvert 24h/24h intitulé DataLeaks pour tous les Bradley Manning en herbe.
Les stats c’est chic Notre société abonde en informations diverses et variées. Et finalement ce sont ceux qui savent sélectionner, choisir et même exploiter cette somme de données qui s’en sortent le mieux. Les mathématiciens traders avec leur capacité à traiter des milliers d’informations à l’aide d’algorythmes divers ont déjà conquis Wall Street. Ailleurs, on prédit que les statisticiens seront sexy avec un job peu stressant ou bien que les Data Scientists seront les futures icônes de la Silicon Valley
En journalisme, c’est pareil : les datajournalistes ont en le vent en poupe. On parle beaucoup du Datablog du Guardian emmené par Simon Rogers. Même si en France on constate que le datajournalisme peine à se développer depuis un an nous devons à quelques jeunes téméraires de porter haut les couleurs de cette branche parmi lesquels Caroline Goulard et Nicolas Kayser-Bril.
Du vieux avec du neuf ? Mais on ne va pas se mentir et Nicolas Kayser-Bryl le rappelle ici , le datajournalisme n’est pas nouveau : quand dans les années 60, Phil Meyer utilise les premiers ordinateurs pour réaliser une enquête statistique sur les émeutes de Détroit, il est le précurseur du datajournalisme. A l’époque on appelle ça le CAR (Computer Assisted Reporting)
Le fait est que travailler avec les données est de plus en plus courant, voire une nécessité, pour savoir traiter des informations en grande quantité de plus en plus complexes (tels que les documents dévoilés par Wikileaks sous format sql). Les journalistes ont toujours manipulé des données aussi cette “nouveauté” peine à convaincre certains journalistes ou lecteurs (voir article et commentaires ici) mais la vraie nouveauté réside sans doute dans l’outil web qui offre, grâce aux développeurs, une nouvelle manière de raconter les histoires et d’y impliquer les internautes. Reste que ce n’est pas non plus une révolution, mais un nouveau champ d’expérimentation interdisciplinaire fait de nouveaux regards, de nouvelles compétences et de nouveaux outils.
Crowdsourcing Dans ce nouveau champ du journalisme, qui n’est pas encore un eldorado, on réalise que le journaliste doit parfois se transformer en chef de projet : à la fois pour récupérer les données comme dans les opérations de crowdsourcing où il lui faudra animer et coordonner une communauté de citoyens et aussi pour créer les outils de visualisation. Là, si le journaliste n’a pas de compétences informatiques, il lui sera difficile, impossible, de se passer d’un bon développeur et d’un graphiste. On peut moquer cette nouvelle vague de l’info(porno)graphievoire même lister ses pires excès.
Il n’en reste pas moins que la visualisation des données est un enjeu majeur à l’heure où les médias papiers effectuent leur migration (finale ?) vers des supports écrans où l’interactivité et l’ergonomie sera de mise.
Mentir avec précision Maintenant, le datajournalisme n’est pas une panacée, on peut faire dire n’importe quoi aux chiffres : ce sont comme des poupées que les (data or not data)journalistes ventriloques font parler. Voici un petit exemple amusant de croisement de données qu’on pourrait assimiler un peu rapidement à du datajournalisme. Ce tableau représente les courbes des taux de natalité et d’entrées de cinéma en France depuis 1946. Or surprise, ces courbes suivent exactement les mêmes tendances : doit-on en conclure qu’aller au cinéma provoque une envie irrépressible de procréer ? Ou bien que la procréation est bénéfique aux entrées en salles ? Ou tout simplement que l’appétit culturel est une mesure de bonheur connexe à la procréation.
On peut aussi bien considérer que ces tendances sont totalement décorélées et qu’il s’agit d’un hasard. Bref, le datajournalisme ici ne ferait que la moitié de son travail s’il n’allait pas enquêter, comparer de manière plus précise pour extraire la substantifique moelle de ces chiffres.
Infirmières californiennes Une des meilleurs explications de ce qu’est le journalisme à l’ère des données nous est largement expliqué dans ce documentaire. Plusieurs exemples d’articles de datajournalisme très intéressants ont fait également date, sans nécessairement faire appel à des techniques sophistiquées de visualisation : Ici une enquête sur le infirmières en Californie décryptée sur le blog monjournalisme.fr.
Le site Owni aussi bien sûr est à l’avant garde en France de ce nouveau champs d’expérimentation : voici un exemple d’enquête et de visualisation sur les morts aux frontières de l’Europe. L’ensemble de leurs enquêtes et applications sont disponibles ici.
Plus récemment la révolution égyptienne vue sur Twitter a été décryptée d’une façon originale.
Enfin, un mot pour finir sur le travail de David Maccandless qui est l’un des fers de lance du datajournalisme. Je vous invite suivre une présentation vidéo de son travail ici.
Maintenant, place aux analyses, interviews et décryptage : amis et ennemis des chiffres bienvenue !
Cet article est en accès libre, pour toutes et tous.
Mais sans les dons de ses lecteurs, StreetPress devra s’arrêter.
Je fais un don à partir de 1€Si vous voulez que StreetPress soit encore là l’an prochain, nous avons besoin de votre soutien.
Nous avons, en presque 15 ans, démontré notre utilité. StreetPress se bat pour construire un monde un peu plus juste. Nos articles ont de l’impact. Vous êtes des centaines de milliers à suivre chaque mois notre travail et à partager nos valeurs.
Aujourd’hui nous avons vraiment besoin de vous. Si vous n’êtes pas 6.000 à nous faire un don mensuel ou annuel, nous ne pourrons pas continuer.
Chaque don à partir de 1€ donne droit à une réduction fiscale de 66%. Vous pouvez stopper votre don à tout moment.
Je donne
NE MANQUEZ RIEN DE STREETPRESS,
ABONNEZ-VOUS À NOTRE NEWSLETTER