Table des matières
Le machine learning (ML), plus connu en français sous l’appellation d’apprentissage automatique, mais également l’intelligence artificielle (IA) sont des notions tendances ces dernières années, qui sont à l’origine d’une augmentation massive de données. Cette croissance de la data a donné naissance à de nouvelles pratiques en entreprise, dont la DataOps.
Le rôle du DataOps est de prendre en charge les projets relatifs aux datas en entreprise, dans le but d’en optimiser à la fois l’usage, le traitement mais également l’analyse. Plus généralement, la Data Operations a pour objectif de rendre la donnée disponible en entreprise, pour permettre son usage par tous les collaborateurs dans une approche analytics.
Pourquoi cet engouement autour du DataOps ? Le constat de départ est simple : face à la quantité massive d’informations générées mais également collectées par les entreprises, il est devenu difficile pour ces dernières d’en tirer profit, devenant victime de l’abondance de données accessibles, mais également des outils non reliés les uns aux autres affichant parfois des données contradictoires.
De nombreux exemples concrets viennent mettre en lumière ce constat :
Pour remettre du sens dans ces méga données d’entreprises, il a fallu définir des processus de traitement et d’exploitation des différentes sources d’informations en entreprise.
Cette nouvelle pratique est à l’origine définie par un document qui fait référence dans le domaine : le DataOps Manifesto (en français “manifeste des opérations data”). Ce dernier énumère en 18 points les principaux critères et principes à suivre pour réussir tout projet de DataOps. Il est principalement destiné aux profils DevOps mais également aux spécialistes de l’Agile en entreprise.
Le terme “agile” n’est pas anodin, puisque ce manifeste est en résumé une application de la méthode Agile au domaine des données. On y retrouve entre autres des notions mettant en lumière l’agilité nécessaire pour mener à bien ce type de projet, comme la capacité d’accepter des changements profonds, la variété de métiers et de compétences impliqués dans ces projets, le suivi de la satisfaction client…
Le métier d’ingénieur DataOps est une des formes concrètes de cette nouvelle pratique : le portrait robot de cet ingénieur de la donnée est celui d’un Bac +5 en informatique, avec un cursus orienté sur la Big Data, à l’aise avec les statistiques, le traitement massif de données, la capacité de synthèse et une lecture intelligente des chiffres… en résumé une appétence data-driven. C’est un rôle qui mélange à la fois des compétences en business intelligence, en statistiques et en IT capable de créer des ponts entre ces différents sujets.