đ€ SpeÌciale IA : deÌroutante, creÌative, massive, acceÌleÌrante, artistique... et tant dâautres choses
La newsletter qui fait parler les donneÌes
La newsletter qui fait
parler les données
đŻ IA beaucoup Ă dire
Pour cette rentrĂ©e, nous vous avons concoctĂ© notre premiĂšre newsletter thĂ©matique : un numĂ©ro spĂ©cial IA. Pourquoi maintenant alors que ces IA gĂ©nĂ©ratives inondent lâactualitĂ© depuis prĂšs de âšdeux ans ? Câest quâĂ WeDoData, on prĂ©fĂšre tester les technos avant dâen parler, sâassurer de leurs rĂ©ponses face aux dĂ©fis de la narration data, les pousser dans leurs retranchements, questionner leur fiabilité⊠Aujourdâhui, aprĂšs des mois de prototypes en tous genres, nous sommes prĂȘts Ă vous partager nos conseils, nos inspirations, nos tutos et les coulisses dâun premier projet rĂ©alisĂ© Ă base dâIA. âš
âïž Dans les prochaines semaines, surveillez bien vos rĂ©seaux car de nombreuses rĂ©alisations nourries dâIA sortiront de nos serveurs : moteur de podcasts boostĂ© Ă lâIA, Ćuvre artistique faisant dialoguer des IA entre elles, datavisualisations dâarchives massivesâŠ
Bonne lecture
âïž LâĂ©quipe de WeDoData
Si vous avez une question, une suggestion de contenu ou de rubrique, nous sommes ici : hello@wedodata.fr
DANS NOTRE SAC
đȘ Les pĂ©pites du mois
â Câest futuriste. PubliĂ©e sur The Pudding, cette enquĂȘte dĂ©goulinante de pixels fluos dĂ©crypte les tendances des scĂ©narios de 200 films de science-fiction de 1950 Ă nos jours. En rĂ©sumĂ©, toujours plus dâapocalypse, de souffrance et dâinĂ©galitĂ©sâŠ
â Câest machinal. Ultime chance de comprendre le machine learning avec ce scrollytelling hyper visuel et pĂ©dagogique - en 13 langues - qui vous initie Ă tous ses concepts-clĂ©s. Pour cela, il sâappuie sur lâexemple dâun modĂšle algorithmique qui dĂ©tecte si une maison est Ă New York ou Ă San Francisco.
â Câest dĂ©visageant. Voici une expĂ©rience dont vous ĂȘtes le hĂ©ros⊠et la victime. La dĂ©monstration est imparable pour comprendre les biais des algorithmes de reconnaissance des visages.
â Câest entraĂźnant. Voici une plongĂ©e - rare - dans LAION-5B, un ensemble dâimages sur lequel se sont entraĂźnĂ©s Midjourney ou Stable Diffusion. InquiĂ©tant et glaçant sur les innombrables biais et illĂ©galitĂ©s qui le composent.
DANS LES COULISSES DEâŠ
đŒïž+đ€ Comment nous avons crĂ©Ă© un gĂ©nĂ©rateur dâexpositions artistiques en 3D (grĂące Ă lâIA)
Le challenge. Au dĂ©part de cette idĂ©e folle, il y a la Fondation KADIST et sa collection de 2 000 Ćuvres dâart contemporain, trĂšs bien documentĂ©es, mais ne disposant pas de lieu dâexposition. Et si les IA aidaient Ă faire connaĂźtre plus largement cet ensemble artistique original ? Bienvenue dans les backstages de notre gĂ©nĂ©rateur dâexpositions artistiques (dĂ©monstration sur demande).
La botte IA secrĂšte. Un des principes-clĂ©s des LLMs est la transformation de texte en vecteur de hautes dimensions (1 536 dans notre cas) : on parle dââembeddingsâ. Quel intĂ©rĂȘt me direz-vous ? Identifier des textes similaires qui auront des vecteurs pointant dans les mĂȘmes directions, comme le schĂ©matise le dessin ci-dessous. Câest cette propriĂ©tĂ© que nous utilisons pour identifier des Ćuvres dâart traitant dâun sujet commun. AprĂšs un travail dâharmonisation, la documentation des Ćuvres en notre possession a ainsi Ă©tĂ© vectorisĂ©e : câest le cĆur du rĂ©acteur de notre gĂ©nĂ©rateur dâexpositions.
Représentation simplifiée de vecteurs associés à des éléments de texte
Dis-moi un thĂšme, je te crĂ©erai ton expo. Lâutilisateur choisit librement le thĂšme de lâexposition dont il rĂȘve : par exemple, âla crise de la dĂ©mocratie en Occidentâ. Sa requĂȘte est alors vectorisĂ©e et 12 Ćuvres pointant sensiblement dans la mĂȘme direction sont rĂ©cupĂ©rĂ©es. âšĂ partir de lĂ , nous utilisons une autre IA, la âcompletionâ dâOpenAI, pour crĂ©er une description gĂ©nĂ©rale de cette exposition sur-mesure đ en se basant sur les textes des Ćuvres, puis encore une autre IA, le âtext-to-speechâ dâOpenAI, pour transcrire les textes đ en audio đ.
Lâaccrochage virtuel des Ćuvres. Dans un espace en 3D (conçu avec le logiciel Blender et la librairie Three.js), les Ćuvres sont disposĂ©es selon lâordre proposĂ© par lâIA. Lâutilisateur peut alors Ă©voluer dans son exposition 100% personnalisĂ©e, passer sa souris sur chacune des Ćuvres, Ă©couter ou lire les descriptions. Et lorsquâil termine sa visite virtuelle, il peut mĂȘme repartir avec un PDF oĂč il gardera une trace des textes gĂ©nĂ©rĂ©s et des Ćuvres sĂ©lectionnĂ©es pour lui.
Last but no least. Un grand bravo à Benjamin Grillet, développeur de génie avec qui nous avons la chance de collaborer, et un grand merci à la Fondation KADIST qui nous a fait confiance et ouvert sa collection pour en explorer les possibles.
POUR ALLER ENCORE PLUS LOIN
â Une vidĂ©o efficace de 5 min pour mieux comprendre les embeddings
â Un exemple pour utiliser les embeddings en Python
LES BONS OUTILS
đ ïž On partage nos meilleures astuces
đ¶ïž Niveau facile
â Pour les flemmards de lâintĂ©gration web. MĂȘme le no-code prĂ©sentait parfois certaines difficultĂ©s. DĂ©sormais, plus aucune excuse pour ne pas crĂ©er votre site web par vous-mĂȘme. Websim.ai le fait pour vous en quelques prompts.
đ¶ïžđ¶ïž Niveau moyen
â Pour les maniaques des donnĂ©es. Votre jeu de donnĂ©es nâest pas propre et vous paniquez devant les milliers de lignes Ă harmoniser ? OpenRefine est notre meilleur alliĂ© depuis prĂšs de 15 ans. Toujours aussi efficace.
đ¶ïžđ¶ïžđ¶ïž Niveau expert
â Pour les prompteurs invĂ©tĂ©rĂ©s. Hugging Face, la plateforme de partage autour de lâIA, nous amĂšne un modĂšle dâIA directement dans le tableur (en lâoccurrence Google sheet). Installez Hugging Face on Sheets et vous pourrez interagir en langage naturel avec vos donnĂ©es dans la feuille de calcul. Un outil open source qui ne cesse de sâamĂ©liorer au fil des suggestions des utilisateurs.
SâABONNER
On vous a transféré cette newsletter ?
Nâoubliez pas de vous inscrire gratuitement pour recevoir les suivantes
« LâIA : câest le pomme Fâš
sous stéroïde »
đ Un journaliste h(i)allucinĂ© đ
LE COIN DO IT YOURSELF
đ§ââïž ChatGPT, notre fidĂšle assistant datajournaliste
LâintĂ©rĂȘt. Vous ĂȘtes face Ă un bon gros jeu de donnĂ©es. Il est tout propre, mais il vous impressionne, vous ne savez pas par quel bout le prendre. Aucun souci : ChatGPT va vous permettre dâidentifier des angles dâattaque et les graphiques les plus pertinents pour les illustrer.
Les prĂ©-requis. Avoir accĂšs Ă la version payante de ChatGPT qui permet dâutiliser ChatGPT 4o, la derniĂšre version ultra-performante. Et fournir une base de donnĂ©es, sous forme dâun fichier Excel ou CSV.
Le mode dâemploi. Nous avons en mains une floppĂ©e de statistiques sur les Ă©missions CO2 dans le monde (format .xlsx) issues du Global Carbon Atlas. LâAtlas mondial du carbone prĂ©sente en effet toutes les donnĂ©es de rĂ©fĂ©rence utilisĂ©es dans les confĂ©rences internationales sur le climat. Fier crĂ©ateur de ce site, WeDoData le met Ă jour depuis dix ans.
đïž Commençons par comprendre ces fameuses donnĂ©es. CrĂ©ons une conversation avec ChatGPT, ajoutons-y notre fichier Excel et demandons lui dâanalyser ce document pour fournir de potentiels sujets.
đš Un angle a retenu notre attention âĂvolution des Ă©missions de CO2 par rĂ©gionâ. Poursuivons lâĂ©change avec ChatGPT en le questionnant sur les dataviz cohĂ©rentes avec ce sujet.
âïž ChatGPT nous propose diffĂ©rentes solutions graphiques, il est temps de choisir. Nous tranchons pour une courbe dâĂ©volution des Ă©missions par rĂ©gion (de type âstacked areaâ). On lui demande de la gĂ©nĂ©rer. Et magie ! La voici en quelques micro-secondes.
đš Il ne reste plus quâĂ âpimperâ notre graphique. Nous pouvons demander, par exemple, Ă GPT de changer les couleurs, de retirer le titre, de grossir, repositionner les lĂ©gendes et mĂȘme de rĂ©aliser⊠un Gif.
đȘ VoilĂ le rĂ©sultat : il ne reste plus quâĂ lâexporter.
Les limites. Si vous ĂȘtes un fĂ©ru des dataviz, vous serez peut-ĂȘtre déçus des propositions de ChatGPT car il reste dans des graphiques assez basiques. Mais câest la porte dâentrĂ©e idĂ©ale pour les dĂ©butants en quĂȘte de simplicitĂ© et de rapiditĂ©.
POUR ALLER ENCORE PLUS LOIN
â LâĂ©quipe de la librairie Highcharts, bien connue des dĂ©veloppeurs de dataviz, a crĂ©Ă© cet outil avec ChatGPT qui vous permettra de gĂ©nĂ©rer des graphiques interactifs avec de simples prompts.
DIFFUSER
Vous aimez Buena Vista Data Club ?
Partagez-la Ă vos proches ou votre rĂ©seau en leur transfĂ©rant par mail âšou via les rĂ©seaux sociaux
âš La bonne reco deâŠ
Clément, data designer
Faire Ă©merger âlâĂąme des donnĂ©esâ
âDataviz concepts - part 1 to 3â - Kirell Benzi - 2021
âĂ quoi servent les 2,5 quintillions dâoctets de donnĂ©es produites chaque jour une fois qu'elles ont Ă©tĂ© collectĂ©es ? Les entreprises les exploitent pour prendre de meilleures dĂ©cisions commerciales. Les scientifiques les analysent pour comprendre notre monde.â Kirell Benzi a dĂ©cidĂ© lui dâen faire des Ćuvres d'art.
âDataviz concepts - part 1 to 3â - Kirell Benzi - 2021
Chercheur en data science, Kirell Benzi commence par façonner ces donnĂ©es, en utilisant des techniques mathĂ©matiques complexes. Le data artiste quâil est aussi prend le relais et gĂ©nĂšre des images via l'apprentissage automatique. Quelles sont les formes et les couleurs correspondant au message contenu dans ces donnĂ©es ? Comment transmettre des Ă©motions fortes ? Selon lui, tout est dans l'Ă©quilibre entre l'Ăąme et les chiffres.
âOn Timeâ - Kirell Benzi (2014)
En 2014, il a produit âOn Timeâ, Ćuvre qui dĂ©coule de l'analyse de 42 millions de positions de piĂ©tons dans la gare de Lausanne. Envie de vous lancer ? Il y a quelques mois, il a fondĂ© la plateforme decode.gl pour partager et enseigner tous ses secrets de crĂ©ation.
đš Explorez son portfolio en ligne.
DANS NOTRE AGENDA
đ Les dates Ă venir
đŒ ApopheÌnies, Interruptions : Artistes et intelligences artificielles au travail. Une installation artistique inĂ©dite faisant converser trois IA sera exposĂ©e au Centre Pompidou du 25 septembre 2024 au 6 janvier 2025. Lâartiste Ăric Baudelaire lâa crĂ©Ă©e avec la collaboration de WeDoData.
đ«đ· Salon de la data et de lâIA propose Ă Nantes le 17 septembre des dizaines dâateliers, dĂ©mos et confĂ©rences, avec lâIA en force cette annĂ©e.
đ”đč Data Makers Fest se tient au Portugal, du 23 au 25 septembre, avec une forte prĂ©sence de lâIA dans les interventions.
đ«đ· Paris Web, le rendez-vous des professionnels francophones du Web, dĂ©fend du 26 au 28 septembre Ă Paris, un web accessible et de qualitĂ©.
đșđž IEEEVIS 2024, la confĂ©rence annuelle sur la visualisation scientifique, rĂ©unit chercheurs et praticiens du 13 au 18 octobre en Floride (Ătats-Unis) pour Ă©changer sur les derniers outils de visualisation.
La viz de la fin
âVisualization and sonification đ„ đč of the Github commit history ofâŠâ est une sĂ©rie de visualisations et sonifications rĂ©alisĂ©e par lâartiste Ren Yuan. Il a rĂ©cupĂ©rĂ© tous les commit Github des plus grandes librairies de code utilisĂ©e en dĂ©veloppement web. Pour ceux qui ne sont pas familiers avec ce jargon, un commit est une mise Ă jour de code pour faire Ă©voluer ces fameuses librairies.âš Ă admirer en les Ă©coutant sur son fil Twitter/X.
Au mois prochain
WeDoData est un studio de datavisualisation, de design dâinformations et de nouvelles narrationsâŻ: wedodata.fr
đȘ On vous a transfĂ©rĂ© cette newsletter ?
Abonnez-vous gratuitement
đȘ Vous prĂ©fĂ©rez lire cette newsletter en ligne
Câest par lĂ
đĄ Vous ne jurez que par un bon vieux flux RSS
Le voici
đ Vous voulez dĂ©jĂ nous quitter ?
DĂ©sabonnez-vous par ici