Decideo - Data Science, Big Data, Intelligence Augmentée cover art

Decideo - Data Science, Big Data, Intelligence Augmentée

Decideo - Data Science, Big Data, Intelligence Augmentée

By: Philippe Nieuwbourg
Listen for free

About this listen

Decideo est la communauté d'information et d'échange autour des outils et meilleures pratiques d'analyse de données (Machine Learning, Business Intelligence, Big Data, Science des Données, Entrepôts de données…). Véritable réseau social des professionnels de la donnée, Decideo est disponible en français www.decideo.fr et en espagnol www.decideo.com. Opinions d'experts, actualités, agenda, offres d'emploi, sont disponibles en ligne et sur les applications mobiles gratuites. Decideo is the leading user community of Business Intelligence, Data Science, Big Data and Analytics professionals. Decideo is a real social network of data driven economy, available in French www.decideo.fr, and Spanish www.decideo.com. User stories, best practices, news, software reviews, agenda, job board… are available online, and through podcast and mobile applications.Copyright Decideo - Tous droits réservés - All rights reserved Economics Management Management & Leadership
Episodes
  • #6.2 Raffineur de données
    Feb 23 2026
    Raffineur de données : un métier indispensable à l'IA Imaginez que vous ayez conçu le meilleur moteur de voiture jamais fabriqué ! Efficient, puissant, économe, silencieux, non polluant… il a toutes les qualités, et vous allez révolutionner le monde du transport grâce à votre invention. Seul bémol, il nécessite pour fonctionner un carburant beaucoup plus pur que ce que l'on trouve aujourd'hui dans nos raffineries. Et ce carburant est indispensable à votre moteur révolutionnaire. Sans lui, votre invention n'est qu'un assemblage inutile de pièces de métal. C'est ce qui arrive aujourd'hui à la majorité des projets d'IA en entreprise. Les modèles sont surpuissants, mais restent de perpétuels adolescents face à la pauvreté des données à partir desquelles vous les alimentez. Vous n'avez pas investi suffisamment dans le raffinage de vos données. « Mais nous avons un data lake depuis plusieurs années ! », me répondrez-vous. Oui, certes, mais appelez-le plutôt un data débarras ! Vous y déversez des données brutes, sans les indexer, sans les référencer, sans les qualifier, sans les améliorer, sans les organiser… tout cela parce qu'un vendeur de data lake vous a convaincu qu'il contenait un Monsieur Propre qui allait se charger de tout. Reconnaissez que vous avez été bien naïf sur ce sujet… Et vous continuez d'ailleurs puisque vous avez cru cet autre vendeur qui vous a convaincu que l'intelligence artificielle elle-même allait savoir créer ses propres métadonnées, et rendre votre débarras miraculeusement aussi propre et documenté qu'un entrepôt de pièces détachées Airbus ! La donnée brute est devenue abondante, bon marché et disponible. Mais la donnée structurée, connectée, contextualisée, documentée, expliquée, celle qui permet l'automatisation réelle, la prédiction et la prise de décision, reste rare. Forcément, elle est plus couteuse et complexe à produire à partir de la donnée brute. Et surtout elle nécessite un effort humain… ce qui n'est pas à la mode en ces temps d'automatisation à outrance. Poursuivant notre analogie automobile, la donnée brute, c'est le pétrole sorti des gisements. La donnée raffinée, c'est le carburant, produit par les raffineries. Et plus votre modèle est avancé, plus le raffinage doit être poussé. Essayez de mettre du pétrole brut dans une voiture… ça marchera beaucoup moins bien. Car l'essence que vous utilisez est raffinée. Elle subit des procédés complexes pour : augmenter son indice d'octane, éliminer le soufre et les impuretés, ajuster sa volatilité, et améliorer sa combustion. Le raffinage nécessaire à vos modèles d'IA est encore plus complexe que la transformation de pétrole brut en essence. En matière de données, c'est exactement la même chose. Utilisez des données brutes dans un modèle, et les résultats seront standards, pas exceptionnels. Vous serez à la portée d'hallucinations et de biais, non pas dus au modèle, mais à vos données. Raffinez vos données et vos modèles pourront enfin s'y appuyer pour produire des résultats exceptionnels. La valeur n'est plus dans le modèle. Elle est dans la capacité à raffiner la donnée. Le raffineur est donc le métier le plus créateur de valeur dans la chaine de production de l'intelligence artificielle. Qui est-il ? Quelles sont ses compétences ? Quelles qualités sont nécessaires ? Je ne tomberai pas dans le piège d'inventer un nouveau métier de Data Refiner. Ce n'est pas le sujet. Tout le monde peut être ou devenir raffineur de données. Mais voici les compétences nécessaires : - Premièrement une connaissance du métier est indispensable. Le raffineur peut donc venir directement du métier, ou être un analyste d'affaires qui se spécialiserait dans l'analyse des besoins en données des modèles d'IA. On évitera un raffineur venant du département informatique, à moins qu'il ne connaisse parfaitement le métier. - Une compréhension étendue du concept de métadonnées est nécessaire. Décrire, expliquer, documenter, formaliser, structurer, organiser… cela passe par la création d'une ontologie, d'une couche sémantique commune. Toutes ces compétences sont souvent détenues par des professionnels du document électronique. Documentalistes et archivistes auront ici une carte à jouer. Et les graphes de connaissance n'ont déjà plus de secrets pour eux. - Et finalement une aptitude à écouter, faire émerger des non-dits, et retranscrire des besoins. Encore une fois, l'analyste métier est à l'aise avec ce mode de fonctionnement. Oreille externe, il cherche à comprendre, à poser les questions, à faire émerger les besoins. Exprimer les attentes de préparation des données brutes pour alimenter les modèles d'IA me semble donc un projet d'analyse métier. Les parties prenantes sont les informaticiens en charge du ...
    Show More Show Less
    6 mins
  • #6.1 Valorisation et monétisation : quelles différences ?
    Feb 17 2026

    Différences entre valorisation et monétisation
    Collectées, stockées et analysées depuis tant d'années, les données sont enfin adultes. Il est maintenant temps de leur permettre d'accéder à leur indépendance financière. La prochaine décennie sera celle de la valorisation et de la monétisation des données.
    Le phénomène a déjà commencé, il y a plusieurs années. Au travers des réseaux sociaux, nos données ont pris de la valeur, même si elle ne nous est pas toujours attribuée. Des règlements ont conduit, en particulier en Europe, à encadrer un peu l'usage de nos données personnelles. Et les techniques comptables et financières (IAS/IFRS) abordent maintenant le sujet de leur valorisation.
    Valoriser, c'est donner une valeur
    Établir la valeur d'une donnée, c'est lui adosser un chiffre et une unité de compte, qui permet de la comparer avec d'autres. L'unité de compte qui vient en premier à l'esprit c'est la monnaie, l'Euro, le dollar, le bitcoin… peu importe. Mais on pourrait en utiliser d'autres, en particulier pour mesurer des impacts sociaux ou environnementaux.
    Définir la valeur de quelque chose dépend fondamentalement du cadre d'analyse que l'on adopte. Il n'existe pas une définition universelle et intemporelle de la valeur, mais un ensemble de définitions cohérentes selon les disciplines, les acteurs et les usages. Une définition générale pourrait en être la suivante : l'importance relative attribuée à un objet, une action ou une ressource par un acteur donné, dans un contexte donné, au regard d'un objectif donné. En entreprise, la valeur d'un bien ou d'un service pourrait être définie de la manière suivante : la contribution mesurable ou appréciable d'un actif à l'atteinte d'objectifs économiques, opérationnels, stratégiques ou réglementaires, pour un ensemble d'acteurs identifiés.
    Combien valent vos données ? Combien vaut votre data warehouse ou votre data lake ? Comment les estimer, les valoriser ? C'est un sujet qui deviendra clef dans les prochaines années. Pourquoi ?
    … parce que pour monétiser des données, je dois les valoriser !
    Monétiser c'est transformer les data de centre de coût en centre de profit
    La donnée est un actif, immatériel, qui a une valeur comme nous venons de le définir. Peut-on transformer cette valeur en espèces sonnantes et trébuchantes ? Oui, cela s'appelle la monétisation. Je ne vais pas vous faire vendre votre fichier client, ou vos données personnelles ! Mais croire que seules ces données ont de la valeur pour quelqu'un c'est très réducteur.
    Un centre commercial qui analyse ses visiteurs… quel pourcentage d'hommes et de femmes, combien ont un chapeau, des enfants, un parapluie, un sac en cuir ou un sac en plastique ? Un péage d'autoroutes qui analyse les marques et modèles de voiture qui entrent et sortent, la présence d'un coffre de toit, de vélos, d'une remorque ? Si ces analyses statistiques n'ont pas de valeur pour lui, elles en auront pour quelqu'un, qui sera prêt à les acheter ou les louer. L'open data était un premier pas, l'économie de la donnée est le second. Cela passe par des produits de données, des contrats associés, des espaces de données, et des places de marché (data products, data contracts, data spaces et data marketplaces). Nous étudierons tout cela.
    Monétiser c'est transformer la valorisation en réalité économique.

    Show More Show Less
    4 mins
  • #5.10 Archives, documents, données... tant de points communs !
    Sep 2 2025

    Margot Georges est consultante en archivistique. Elle est également productrice du podcast Archivistica, consacré à ce domaine. Archivistica est disponible sur toutes les applications de podcast et sur https://shows.acast.com/archivistica

    Données et documents, archives et sauvegardes, bases de données et GED... nos métiers (de l'information, et de la donnée) utilisent des termes différents. Mais donc la signification est souvent plus proche qu'on ne l'imagine. Les "professionnels de l'information" et les "professionnels des données" semblent ne pas se comprendre... mais chacun n'adopte-t-il pas une position exagérée. Quelles sont nos divergences et nos convergences.
    De mon point de vue, les professionnels du traitement des documents ont énormément de choses à apprendre aux professionnels de la donnée. A condition que ces derniers acceptent d'écouter, et parfois de se remettre en question. Mais l'inverse est également vrai. Les professionnels du document doivent accepter que le monde évolue, et que la transformation numérique impact le fondement de leur métier. Les professionnels de la donnée ont également des choses à partager avec eux.
    Je rêve d'une entreprise où gouvernance des données, archives, documentation, informatique... se rencontreront autour d'une même table pour définir une stratégie commune, au service de la valorisation du patrimoine informationnel. Et Margot souhaite elle-aussi que nos métiers dialoguent plus ensemble.

    Show More Show Less
    36 mins
No reviews yet