AI & ML interests
None defined yet.
Démarche
La plateforme des données publiques françaises, data.gouv.fr, est développée par la DINUM (Direction Interministérielle du Numérique) et a été créée par Etalab. Elle propose en novembre 2025 plus de 70 000 jeux de données provenant d'administrations et organismes français comme l'INSEE, Santé Public France, la CNIL, l'IGN, différents ministÚres, etc.
Pour faire connaĂźtre cette source qui peut ĂȘtre trĂšs utile, notamment depuis l'essor des agents IA qui doivent se baser sur des sources de qualitĂ© pour ĂȘtre performants, nous avons portĂ© quelques jeux de donnĂ©es sur Hugging Face. IIl ne s'agit pas des jeux de donnĂ©es en eux-mĂȘmes mais seulement de leur description pour donner ensuite envie Ă l'utilisateur de se rendre sur le site de data.gouv.fr pour rĂ©cupĂ©rer les donnĂ©es pour son cas d'usage. Plus prĂ©cisĂ©ment, nous avons listĂ© uniquement les jeux de donnĂ©es dont les mĂ©tadonnĂ©es sont activement renseignĂ©es (data.gouv.fr proposant un score entre 0 et 1 pour la qualitĂ© des mĂ©tadonnĂ©es, nous avons rĂ©coltĂ© tous ceux ayant un score supĂ©rieur ou Ă©gal Ă 0.8). Ils reprĂ©sentent environ 10% des jeux de donnĂ©es disponibles sur data.gouv.fr.
Nous ne portons pas les donnĂ©es directement sur Hugging Face car plusieurs jeux de donnĂ©es disponibles sur data.gouv.fr sont actualisĂ©s quotidiennement. Il vaut ainsi mieux utiliser directement leur API pour plus de facilitĂ©. De plus, porter 70 000 jeux de donnĂ©es serait extrĂȘmement chronophage.