Data scientist : le job en or du Big Data
Le Data scientist s’impose comme le métier emblématique du phénomène Big data. Profil rare -- et donc recherché -- le Data scientist associe trois compétences fortes : les mathématiques, la programmation et les connaissances métiers (marketing, par exemple).
Un nouveau métier : le Data Scientist
S’il est un nouveau métier caractéristique du Big Data, tout du moins par le « buzz » qu’il provoque, c’est bien celui de data scientist que l’on pourrait traduire par « scientifique de données ». On le retrouve même en tête du classement des « jobs les plus sexy du 21e siècle », publié par la Harvard Business Review.
On associe généralement trois compétences fortes chez un data scientist : les méthodes mathématiques et statistiques, la programmation et la compréhension des enjeux métier.
On distingue deux catégories de data scientists :
- Les data architects interviendront en premier lieu pour définir la plateforme technique et les solutions logicielles adaptées. Clusters Hadoop, bases NOSql ou framework Spark seront des termes de leur vocabulaire courant.
- Les data analysts prendront la suite en appliquant des algorithmes prédictifs, au moyen des langages R ou Python, augmentés des librairies RHadoop ou ScikitLearn.
Les plus créatifs d’entre eux complèteront les restitutions de données par des visualisations programmées en D3.js.
Les grandes écoles ne s’y trompent pas et des cursus spécialisés data scientists ont émergé en France (ENSAE, ENSAI, HEC Paris, Telecom ParisTech…)
6 000 Data Scientists en France
Les véritables profils de data scientists, en particulier séniors ou expérimentés, ne courent pas les rues et sont fortement chassés par les cabinets de recrutement. Une simple recherche des mots clés « data scientist » sur le réseau social LinkedIn recense ainsi environ 330 000 personnes dans le monde dont environ 6 000 en France. Face à cette pénurie annoncée -- mais est-elle si réelle dans les faits, beaucoup d’entreprises n’ayant pas encore lancé leur recrutement --, une autre stratégie s’impose.
La Pizza Team : une équipe pour le Big Data
L’entreprise peut prendre le parti de réunir des compétences internes existantes et d’organiser des montées en compétence sur les nouvelles technologies du Big Data. On parlera alors de « pizza team », où chacun apporte sa pierre à l’édifice, ou plutôt son ingrédient à la recette !
On prendra alors soin de réunir cette équipe au sein d’un datalab, structure légère disposant de ressources matérielles suffisantes pour mener à bien les premières démonstrations appelées Proofs Of Concept (POC) et surtout, Proofs Of Value (POV), preuve de la réelle valeur ajoutée du Big Data. Ainsi, un cluster Hadoop constitué de 3 ou 4 nœuds pourra constituer un premier bac à sable (sandbox) très acceptable pour initier les premiers projets.
Dans la jungle des dénominations des nouveaux métiers liés au Big Data, citons également le Data Chief Officer, en charge de guider l’entreprise dans sa gestion de la donnée, et le Growth Hacker, sorte de petit génie d’Internet, capable d’aspirer les sources de données les plus déstructurées, disponibles sur le Web.
Si ces premières pistes pour constituer votre équipe Big Data vous ont intéressées, venez découvrir les autres aspects d’un projet Big Data en suivant le stage de formation Cegos Les fondamentaux du Big Data.
Lire aussi : Les 4 sources du Big Data
Crédit photo data scientist, shutterstock