đ«±đ»âđ«Čđœ Des EÌtats pas treÌs unis, des humains et des IA, des cartes en 3 clics, des freÌquences sonores et des piles de bouquins
La newsletter qui fait parler les donneÌes
La newsletter qui fait
parler les données
đ€ LâĂ©quation humains + tech
En bientĂŽt treize ans dâexistence, WeDoData aura traversĂ© moult rĂ©volutions technologiques, certaines plus Ă©phĂ©mĂšres que dâautres. Avec Ă chaque fois, les mĂȘmes interrogations lorsque nous les expĂ©rimentons : permettent-elles Ă la visualisation de donnĂ©es de bien/mieux sâexprimer ? Dâinventer de nouvelles expĂ©riences de dataviz ? De toucher de nouveaux publics ? De promouvoir une meilleure culture des donnĂ©es ? Aujourdâhui, lâIA ne dĂ©roge pas Ă ces questions chez nous.
âïž Dans cette nouvelle Ă©dition, dĂ©couvrez donc comment nous avons choisi de faire collaborer humains et IA Ă lâINA.
+ un tuto sur Khartis, lâoutil qui vous Ă©vitera tous les piĂšges de la carto
+ des disques et des livres au service la dataviz
+ toujours de folles inspirations
LâĂ©quipe de WeDoData
đ Si vous avez une question, une suggestion de contenu ou de rubrique, nâhĂ©sitez pas Ă nous Ă©crire : [email protected]
DANS NOTRE RADAR
đ Ces data(viz) font lâactu
â Des cĆurs tiraillĂ©s. Moritz Stefaner, cĂ©lĂšbre data-designer, a obtenu les recherches Google des AmĂ©ricains depuis 20 ans et de maniĂšre gĂ©olocalisĂ©e. DĂ©couvrez la visualisation interactive dâun pays dont les territoires se dĂ©forment au rythme des vagues dâintĂ©rĂȘt pour lâimmigration, lâavortement, le mariage gay ou encore le contrĂŽle des armesâŠ
Ă prendre le pouls
â Des yeux troublĂ©s. Face au flot dâimages qui inondent le web et les rĂ©seaux sociaux, ABC lance une alerte : les outils de dĂ©tection de montages photos nây voient que du feu face aux images gĂ©nĂ©rĂ©es par des IA. Le mĂ©dia australien dĂ©voile donc des astuces trĂšs concrĂštes pour Ă©duquer votre regard aux incohĂ©rences de ces images : seule planche de salut face Ă la dĂ©sinformation.
Ă scruter
â Des corps Ă©chauffĂ©s. Pendant une canicule, la tempĂ©rature ne tombe pas la nuit, une Ă©preuve notamment dans les zones urbaines. Explorant six grandes villes du monde, les journalistes de la SĂŒddeutsche Zeitung nous narrent six nuits dâĂ©tĂ© et comment la vivront, les riches dâun cĂŽtĂ© et les pauvres de lâautre.
à dégouliner
DANS LES COULISSES DEâŠ
đ€+đ€ Comment data.ina a osĂ© la transparence sur un site 100% IA
Une premiĂšre mondiale. Depuis prĂšs de deux ans, lâInstitut National de lâAudiovisuel planche avec WeDoData sur un site inĂ©dit de tendances mĂ©diatiques calculĂ©es par des outils dâIA. Data.ina.fr, câest son petit nom, a Ă©tĂ© mis en ligne il y a quelques semaines et vous donne Ă voir, pour la premiĂšre fois, les personnalitĂ©s et les pays les plus mentionnĂ©s depuis 5,5 ans sur les tĂ©lĂ©s đș et radios đ» françaises. Il se veut une premiĂšre rĂ©ponse de lâINA Ă la question : âComment exploiter et donner du sens Ă la masse de donnĂ©es que reprĂ©sentent les 25 millions dâheures archivĂ©es dans le cadre du dĂ©pĂŽt lĂ©gal ?â
Lâenjeu. Pour accomplir ce dĂ©fi de taille (700 000 heures analysĂ©es), deux types dâoutils IA ont Ă©tĂ© identifiĂ©s : celui qui transforme du son đą en texte đ (la transcription, ici assurĂ©e par Whisper) et celui qui identifie des noms de personnalitĂ©s đ·ïž et de lieuxđ(la reconnaissance dâentitĂ©s nommĂ©es, ici rĂ©alisĂ©e par TextRazor). Mais quelle attitude adopter face aux biais et hallucinations connus de ces technologies ?
đĄïž Action N°1 : calculer leur fiabilitĂ©. Cela paraĂźt une Ă©vidence pour les chercheurs, mais cela est plus rare pour un mĂ©dia : assumer une totale transparence sur le taux de confiance des IA utilisĂ©es. Pour cela, lâINA a organisĂ© une âVĂ©ritĂ© terrainâ, comme dans tout protocole de recherche : en rĂ©sumĂ©, il a fait analyser les mĂȘmes extraits de tĂ©lĂ©vision et de radio dâun cĂŽtĂ© par les outils dâIA de ce projet et, de lâautre, par des documentalistes de lâINA. La comparaison des rĂ©sultats des deux process donne le taux de fiabilitĂ© de la chaĂźne de traitement IA mise en place par lâINA : 83% pour ce site !
đ Action N°2 : aucun site au monde ne donne Ă voir les biais de ses IA, rĂ©sultat par rĂ©sultat. LâINA lâa fait en crĂ©ant âle contrĂŽle de pertinenceâ. MĂ©thode de contrĂŽle Ă appliquer, outil mĂ©tier Ă crĂ©er, âBibleâ de biais Ă constituer⊠LâINA et WeDoData ont dĂ» tout inventer. Ainsi, une Ă©quipe de documentalistes, ayant une bonne connaissance de lâactualitĂ©, a Ă©tĂ© mobilisĂ©e pour vĂ©rifier de maniĂšre systĂ©matique les Tops 20 mensuels des chaĂźnes de tĂ©lĂ©vision et de radio proposĂ©es sur le site : 1 020 Tops X 20 personnalitĂ©s = 20 400 mĂ©dias ont ainsi Ă©tĂ© visionnĂ©s/Ă©coutĂ©s đ€Ż. Ce contrĂŽle unique en son genre consiste, entre autres, Ă remonter Ă la source pour vĂ©rifier que la personnalitĂ© citĂ©e apparaĂźt bien dans le mĂ©dia original. Si ce nâest pas le cas, une alerte apparaĂźt sur le site accolĂ©e au nom de cette personnalitĂ© âïž.
đ„ Nos biais âprĂ©fĂ©rĂ©sâ
Ă lâavenir, une meilleure prise en compte du contexte dans la phrase permettra aux outils dâIA dâĂ©viter certaines confusions sur ces noms de personnalitĂ©s. En attendant, voici celles qui ont rythmĂ© nos derniers mois de fiabilisation du site :
đŒ Richard Wagner : le compositeur allemand remonte beaucoup dans les rĂ©sultats issus dâIA, alors quâil sâagit du groupe paramilitaire russe Wagner.
đȘ¶ Paul Verlaine : le poĂšte français remonte trĂšs haut sur les chaĂźnes dâinformation en continu. En cause : une confusion avec le groupe Verlaine, entreprise de rĂ©novation Ă©nergĂ©tique, qui sâest offert une campagne de publicitĂ© pendant quelques mois sur ces chaĂźnes.
đ Boris Johnson, lâancien Premier ministre britannique, se retrouve trĂšs mentionnĂ© dans lâactualitĂ© Ă une pĂ©riode Ă©loignĂ©e de son mandat. Câest que lâIA le confond parfois avec le vaccin Johnson & Johnson.
POUR ALLER ENCORE PLUS LOIN
â Les rĂšgles gĂ©nĂ©rales de data.ina.fr ont Ă©tĂ© particuliĂšrement dĂ©taillĂ©es pour offrir toute la transparence possible sur les mĂ©thodes et outils utilisĂ©s
â Pour ce projet, lâINA a rĂ©digĂ© une Charte dâutilisation de lâIA sur data.ina.fr
LES BONS OUTILS
đ ïž On partage nos meilleures astuces
đ¶ïž Niveau facile
â Pour les poseurs de fanions. Arrive toujours ce moment dans la vie dâun data designer oĂč il faut classer des pays dans un graphique. Et oĂč lâoption dâajouter des drapeaux nâest pas nĂ©gociable. Voici SVG Flag icons, une librairie complĂšte des drapeaux du monde Ă rĂ©cupĂ©rer, en un clic, au format SVG.
đ¶ïžđ¶ïž Niveau moyen
â Pour les podcast lovers. Une fonctionnalitĂ© Ă©tonnante a fait son apparition dans NotebookLM, lâoutil IA de gestion de documents de Google : Audio Overview. En plus dâĂ©changer avec un chatbot sur les ressources que vous avez importĂ©es, NotebookLM propose aussi de gĂ©nĂ©rer (et tĂ©lĂ©charger) un podcast oĂč deux anglophones se lancent dans une conversation plus vraie que nature Ă partir de votre contenu (PDF, sites Web, vidĂ©os YouTube, fichiers audio, Google Docs ou Google Slides). Ils le rĂ©sument, Ă©tablissent des liens entre les sujets et Ă©changent mĂȘme des plaisanteries !
đ¶ïžđ¶ïžđ¶ïž Niveau expert
â Pour les codeurs un peu flemmards. Ă WeDoData, nous adorons la librairie highcharts.com, car elle offre une palette quasi infinie de customisation de graphiques interactifs. DĂ©sormais, vous pouvez interagir avec son GPT, spĂ©cialement entraĂźnĂ© sur sa documentation. Fournissez lui vos donnĂ©es, et en quelques prompts, il rĂ©alise le graphique souhaitĂ© et vous livre son code.
SâABONNER
On vous a transféré cette newsletter ?
Nâoubliez pas de vous inscrire gratuitement pour recevoir les suivantes
« Câest pas trĂšs carrĂ© cette histoire de ronds. »
đ” Un designer dĂ©semparĂ© đ”âđ«
LE COIN DO IT YOURSELF
đïžïž Khartis, un outil simple pour des cartes expertes
LâintĂ©rĂȘt. Vous voulez vous lancer dans une cartographie, mais vous ne savez pas par quel outil commencer ? Il est clair que dans la jungle des outils existants - Magrit, ArcGIS, QGis, Mapbox, Unfolded, etc. -, on aurait bien besoin⊠dâune cartographie des outils de carto !
Voici Khartis, dĂ©veloppĂ© par lâAtelier de cartographie de Sciences Po, qui, en quelques clics (gratuits), vous livrera une carte statistique, tout ceci en vous Ă©vitant les piĂšges tendus par la reprĂ©sentation de donnĂ©es.
Les prĂ©-requis. Aucun, tellement lâoutil en ligne vous prend par la main Ă travers ses 3 Ă©tapes-clĂ©s : donnĂ©es / visualisations / export
Ce quâil faut retenir.
đ Plusieurs fonds de cartes sont disponibles, mais vous pouvez aussi importer le vĂŽtre. Idem, vous avez la main sur le type de projection et les rĂ©glages de longitude et de rotation.
𧟠DĂšs que vos donnĂ©es sont importĂ©es, lâoutil aide Ă repĂ©rer les erreurs potentielles : celles dâidentifiant de pays, de codes INSEE, etc.
đ En fonction des donnĂ©es fournies, certains types de reprĂ©sentations seront accessibles ou non : impossible de rĂ©aliser un impair.
đïž Une fois la reprĂ©sentation choisie, vous ĂȘtes guidĂ©s sur lâagencement de vos donnĂ©es : regroupement en classes (au doux nom de âdiscrĂ©tisationâ), valeur de rupture, hachures et/ou gammes de couleurs, etc. Lâoutil embarque par ailleurs une simulation du rendu pour les dĂ©ficiences visuelles.
đŒïž Lâexport de lâimage finale peut se faire en PNG ou SVG : ce dernier est idĂ©al pour re-travailler la carte dans un logiciel dâĂ©dition dâobjet vectoriel (Illustrator, FigmaâŠ). Et vous pouvez dĂ©finir les dimensions dâexport en pixels.
đ„ïž Khartis peut sâinstaller directement sur votre ordinateur (Mac, PC ou Linux) pour travailler en local, sans connexion Internet. Attention, Ă l'heure actuelle, la version hors ligne ne dispose pas des derniĂšres fonctionnalitĂ©s.
POUR ALLER ENCORE PLUS LOIN
â MaĂźtriser Khartis Ă la perfection ? Suivez le guide et plongez-vous dans la documentation de lâoutil.
â LâAtelier de Cartographie de Science-Po ne sâest pas arrĂȘtĂ© en si bon chemin et a dĂ©veloppĂ© un autre outil, Graticule. La promesse ? Votre fond de carte en 5 Ă©tapes.
DIFFUSER
Vous aimez Buena Vista Data Club ?
Partagez-la Ă vos proches ou votre rĂ©seau en leur transfĂ©rant par mail âšou via les rĂ©seaux sociaux
âš La bonne reco deâŠ
Clément, data-designer
Des pochettes dâalbum âdata-drivenâ
©Tiziana Alocci - âPath Integral IVâ,2020
La data designeuse Tiziana Alocci crĂ©e des pochettes dâalbums mixant Ă©motion musicale et data. Tout a commencĂ© en 2019 avec le label berlinois Sum Over Histories et un rituel immuable : lâĂ©coute de lâalbum pour identifier le morceau le plus ârĂ©sonnantâ pour elle. Ce titre devient lâambassadeur de l'album : câest Ă partir de lui quâelle crĂ©e la visualisation radiale de chaque pochette. Cette derniĂšre mixe le graphique de frĂ©quence du son, mais aussi des marqueurs visuels dĂ©rivĂ©s des sensations ressenties : pointues ou nettes, floues ou ondulĂ©es⊠En rĂ©sultent de magnifiques Ćuvres dâart abstraites Ă interprĂ©ter librement.
©Tiziana Alocci - De gauche Ă droite :âš
âTrial and Errorâ EP, 2021 / âLet the Mistery Beâ EP, 2021 / âFlageoletâ EP, 2021
đ Retrouvez ses crĂ©ations sur son site Internet
đ€ Interview de Tiziana Alocci sur le site Nightingale
DANS NOTRE SAC
đȘ Les pĂ©pites data du mois
â Câest flagrant. Cette heatmap dâInformation Is Beautiful dĂ©voile les mots de passe Ă 4 chiffres les plus courants : 20 combinaisons reprĂ©sentent 27% des codes dans le monde.
â Câest ondulant. Erin Davis nâa pas seulement rĂ©alisĂ© une carte de toutes les stations de radio aux Ătats-Unis, elle donne aussi Ă voir subtilement leurs zones de diffusion. Elle explique tout ici.
â Câest bruyant. Ambiance garantie avec les 30 000 sons de la banque sonore de la BBC. Bruits dâanimaux, dâenvironnement naturel, de villes, de machines industrielles⊠le tout classĂ© par catĂ©gorie, gĂ©ographie, durĂ©e et en accĂšs libre !
â Câest timbrĂ©. Peter Orntoft met de la dataviz partout : sur des photos, mais aussi sur des timbres. Lors de la derniĂšre prĂ©sidentielle amĂ©ricaine, il avait imaginĂ© cette sĂ©rie de timbres pour dĂ©fendre le vote par correspondance.
La viz de la fin
Pas le temps de lire. Cela fait des semaines que votre livre prend la poussiĂšre sur la table de nuit ? Vous ĂȘtes dĂ©sespĂ©rĂ© car votre ado nâa pas lu un livre de tout lâĂ©tĂ© ? Les causes sont multiples, mais les 12 heures passĂ©es chaque semaine, en moyenne en France, sur les rĂ©seaux sociaux nây sont pas pour rien. Kinokuniya, chaĂźne japonaise de librairies, a eu lâidĂ©e gĂ©niale de matĂ©rialiser ce temps virtuel avec un dispositif de visualisation dĂ©voilant les piles de livres que nous aurions pu lire si lâon sâĂ©tait dĂ©connectĂ© de chacun de ces rĂ©seaux.
Au mois prochain : RDV le 5 décembre !
Avant de nous quitter, quelques dates Ă ne pas rater :
đ«đ· Hackathon GenAI, le 13 novembre Ă Paris, organisĂ© par Simplon pour OpenAI, avec pour objectif : crĂ©er 8 solutions concrĂštes basĂ©es sur lâIA gĂ©nĂ©rative pour amĂ©liorer lâinclusion et lâaccessibilitĂ©.
đ«đ· Paris AI Forum 2024, du 19 au 20 novembre Ă Paris, organisĂ© par WAN-IFRA, lâassociation mondiale des Ă©diteurs de presse.
đșđž Data for Black Lives, du 18 au 20 novembre Ă Miami, pour initier des changements concrets, via les donnĂ©es, dans la vie des Noirs amĂ©ricains.
WeDoData est un studio de datavisualisation, de design dâinformations et de nouvelles narrationsâŻ: wedodata.fr
đȘ On vous a transfĂ©rĂ© cette newsletter ?
Abonnez-vous gratuitement
đȘ Vous prĂ©fĂ©rez lire cette newsletter en ligne
Câest par lĂ
đĄ Vous ne jurez que par un bon vieux flux RSS
Le voici
đ Vous voulez dĂ©jĂ nous quitter ?
DĂ©sabonnez-vous par ici