L’intérêt porté aux données depuis quelque temps par les entreprises a fait naître de nouveaux métiers. On entend désormais parler de data architect, data consultant, data scientist … S’il y a une seule chose qui réunit ces différents corps de métier, c’est bien entendu « la data » (la donnée).

Vous nourrissez le rêve de devenir data scientist parce que passionnée de data, dans cet article, nous vous disons ce que vous devez savoir afin d’embrasser cette carrière qui à en croire de nombreuses sources à de beaux jours devant elle.

Le data scientist, le superman ?

Le métier de data scientist est un métier « nouveau », né de la digitalisation de bon nombre d’entreprises. L’intérêt et l’engouement des entreprises à la data a rendu obligatoire la sollicitation des data scientists.  Selon bon nombre d’analystes, la demande en termes de spécialistes de la data est plus forte que le nombre de professionnels disponibles.

Très souvent, les data scientists sont sollicités afin de résoudre des problèmes assez complexes. Ces problèmes relevant souvent du domaine du marketing, nécessitent un sens d’analyse très aigu, mais aussi de solides compétences en mathématiques.

Afin de parvenir à sa mission, celle de dégager des modèles à partir des données et de générer des informations en se basant toujours sur les données, le data scientist doit faire preuve d’une grande rigueur. Chaque entreprise ayant ses spécificités, les réalités et besoins sont particuliers. Le data scientist est donc obligé bien souvent de proposer des solutions « adaptées » au besoin des entreprises au lieu d’avoir une solution valable pour tous.

Des données à grande échelle

Les données sont le cœur du métier de data scientist. Ce qui fait la complexité du métier de data scientist, c’est la grande quantité de données disponibles aujourd’hui en raison de l’intérêt que les entreprises y portent. Le data scientist se retrouve donc obligé d’analyser d’importantes quantités de données afin de tirer les informations nécessaires.

En plus du grand volume de données à analyser, le data scientist est obligé de faire face à la non-organisation des données. Des données sont parfois réparties entre plusieurs sources et il revient au data scientist de trouver la « bonne formule » afin de pouvoir les harmoniser.

Il existe tout de même de nombreux outils de big data tels que : Hadoop et Spark afin d’aider le data scientist dans sa mission.

Des compétences techniques

La science des données ou « data science », est en réalité le fruit d’une fusion de plusieurs domaines tels que : la programmation, les statistiques, les mathématiques … Le data scientist se retrouve donc dans l’obligation d’être pluridisciplinaire et de maîtriser plusieurs sous constituants de ces disciplines. Il est bien évidemment plus facile de se spécialiser dans un de ces domaines que de chercher à s’approprier les notions de tous ces domaines. La profession de programmeur par exemple, à elle toute seule, nécessite de longues années d’étude. Il est vrai qu’aujourd’hui, la programmation est devenue comme une compétence auxiliaire qu’on oblige tous les professionnels à maîtriser.

Une maîtrise du domaine d’activité

On peut être tenté de croire qu’il suffit d’être excellent en matière d’ingénierie informatique pour devenir un bon data scientist. Cette perception n’est pas réellement juste puisqu’il est nécessaire afin de proposer des solutions fiables que le data scientist ait une certaine maîtrise du domaine d’où proviennent les données qu’il doit traiter. Les données utilisées par exemple dans le domaine des finances, ne seront pas identiques à celles utilisées dans le monde de la santé ou à celles utilisées dans le domaine commercial.

Loin donc de se contenter des notions acquises en ligne ou au cours des camps d’entraînement, le data scientist doit chercher à s’approprier les réalités du domaine d’intervention de son « client ».

Data science rime avec pratique

Il est vrai que le métier de data scientist fait souvent appel comme énoncé plus haut à de nombreuses disciplines. Toutefois, ce qu’il faut garder à l’esprit, c’est qu’au-delà de tout, la data science est basée sur la pratique. Mieux, en data science, les concepts sont vaporisables. En d’autres termes, vous êtes obligés de pratiquer les connaissances théoriques acquises afin de ne pas les oublier.

Pour aller plus loin…