La prochaine version de la spécification du produit de données ouvertes intègre le monitoring en tant que code pour la qualité des données.
La spécification du produit de données ouvertes (ODPS) prévoit d’intégrer le monitoring en tant que code dans sa prochaine version, prévue pour mi-2024, afin d’améliorer la qualité des données et de répondre aux exigences des praticiens.
Points clés
- La norme ODPS est une norme ouverte et neutre pour les métadonnées des produits de données numériques.
- Elle définit les objets et les attributs ainsi que la structure des produits de données.
- La norme est basée sur des normes existantes, des meilleures pratiques et des concepts émergents tels que Data Mesh.
- L’ODPS change le modèle de métadonnées du produit de données vers un modèle autonome, ce qui aide à découpler le produit de données des systèmes souvent directement associés à celui-ci.
- Le développement de la norme est coordonné par l’initiative Open Data Product (ODPI), qui a été créée en juillet 2022 pour permettre à la spécification de croître et de devenir institutionnalisée.
- L’ODPI est sous l’égide du chapitre open source d’Open Collective.
- La qualité des données est essentielle pour prendre des décisions éclairées et améliorer l’efficacité des entreprises.
- L’ODPS définit actuellement la qualité des données en fonction de valeurs cibles dans sa version 2.1.
- La prochaine version de l’ODPS, prévue pour mi-2024, prendra en charge six dimensions de la qualité des données, y compris des éléments de monitoring en tant que code.
- Les utilisateurs pourront définir des valeurs cibles pour chaque dimension de la qualité des données, ainsi que des éléments de monitoring en tant que code.
- Les systèmes de monitoring tels que SodaCL et Montecarlo peuvent être utilisés pour mettre en œuvre le monitoring en tant que code.
À retenir
Si vous cherchez à monétiser vos données, il est important de suivre une norme ouverte et neutre pour les métadonnées de vos produits de données. La norme ODPS est une excellente option car elle est basée sur des normes existantes, des meilleures pratiques et des concepts émergents tels que Data Mesh. De plus, le développement de la norme est coordonné par une initiative ouverte et transparente, ce qui garantit que la norme évoluera en fonction des besoins du marché.