Testez vos compétences 😉 ...
BlocsDeCompetences .org

Quels métiers ? Quelles formations ? Quels diplômes ?

Expert en sciences des données (MS) (RNCP35197)

Formation (et/ou diplôme) proposée au RNCP par le certificateur : INST NAT SCIENCES APPLIQUEES ROUEN

Branches de formations NSF

NSF 3xx Domaines technico-professionnels des services > NSF 32x Communication et information > NSF 326 Informatique, traitement de l'information, réseaux de transmission >
> NSF 326m Informatique, traitement de l'information >

Activités visées par cet enseignement

L'expert en sciences des données réalise la gestion et l'analyse pointue des données massives pour la stratégie et l'opérationnel de l'entreprise. Dans ce cadre, il réalise plusieurs activités : dans ce premier grand champ d'activité, il va analyser les données, en procédant à leur analyse dans le cadre de la modélisation des données massives hétérogènes ou non d'une entreprise puis il va élaborer un modèle prédictif de traitement de données afin de modéliser ces données. dans un second grand champ d'activités, il va s'atteler à extraire et collecter des données via une technique d'analyse et de stockage pour chaque donnée ; il va réaliser le traitement et l'exploitation des données collectées et veiller à l'amélioration continue du traitement des données structurées ou non structurées. enfin, il va avoir pour mission d'élaborer une stratégie d'exploitation et de valorisation de la donnée lui permettant d'exploiter les données hétérogènes de la structure, puis d'organiser et planifier des projets de la structure, de façon collaborative et avec les différents services de la structure concernés par la donnée.
[Se référer à la fiche source pour plus de détails]

Appellations professionnelles possibles

  • L'expert en sciences des données (data scientist) détermine et met en oeuvre une stratégie de collecte des données massives, complexes et hétérogènes (structurées ou non structurées), afin d'en retirer l'information pour une prise de décision optimale. Il maîtrise les méthodes efficaces de collecte, stockage, mise en forme, visualisation, modélisation et traitement de ces données. Il explore les données de multiples sources dispersées. Suivant les secteurs et les structures, il assure les postes et fonctions suivantes :
  • Data analyst et data scientist : procède à des analyses sur les approches statistiques possibles en relation avec des enjeux métiers. Conçoit et déploie des modèles prédictifs. Maintient, améliore et conçoit des algorithmes d'extraction d'information. Traduit les données en leviers opérationnels, accompagne les développeurs jusqu'au déploiement en production des solutions et assure une veille technologique.
  • Consultant valorisation des données : analyse les besoins clients big data, définit les architectures applicatives et techniques nécessaires au traitement des données, conçoit des modèles de données, participe au développement et à l'implémentation des algorithmes de traitement, à la mise en production, rédige la documentation associée et effectue la veille technologique sur les nouvelles tendances autour de l'exploitation des données.
  • Business analyst/business developer : interface indispensable entre les départements opérationnels de l'entreprise et le service informatique, il analyse le processus d'information et les stratégies au service de la prise de décision quotidienne de sa société afin d'en évaluer l'efficacité ou d'apporter les ajustements nécessaires.
  • Autres appellations de fonctions possibles :
  • Ingénieur d'étude et développement de données massives
  • Strategy manager/project manager
  • L'expert en sciences des données est un cadre détenant des compétences techniques, scientifiques et transversales faisant de lui un vecteur facilitant la prise de décision en entreprise. Il est à même d'intervenir au plus haut niveau de la stratégie de l'entreprise. Il est l'interlocuteur privilégié du Directeur des Systèmes Informatiques, comme du Directeur Marketing, du Directeur R&D ou Bureaux d'études, comme encore du Président de start up. Son niveau de responsabilité varie en fonction du positionnement de l'entreprise et de sa stratégie de valorisation des données. Il est amené à travailler dans un environnement multi-échelle, à l'interface entre différents services : R&D, informatique, marketing, ressources humaines, direction financière, direction générale, etc.

Environnements de travail

  • L'expert en sciences des données travaille sur des technologies numériques à haute valeur ajoutée intellectuelle et technique dans des entreprises de toutes tailles : grands groupes, sociétés de prestations (consultants), collectivités territoriales, PME, startups.
  • Il peut exercer son activité dans les secteurs suivants : les banques, les compagnies d'assurances, les sociétés de transport, les cabinets de conseil, les entreprises spécialisées dans l'énergie, le web marketing, les plateformes d'e-commerce, l'industrie, la R&D.

Outils d'auto-évaluation gratuits, orientés soft-skills ou orientation professionnelle

  • TestdOrientation.com : Un test qui a le mérite de proposer une évaluation RIASEC pour repérer des listes de métiers.
  • FicheDePersonnalite.com : Un test de personnalité plutôt complet (mais un peu long) et qui donne des évaluations relatives à des groupes socio-professionnels.

Vous trouverez des détails sur les soft-skills sur le site :
Soft-skills.info

BLOCS DE COMPETENCES ENSEIGNÉS

FRANCE-COMPETENCES
RNCP35197BC03

FORMATION AU BLOC :
Concevoir une stratégie de valorisation de la donnée

C1.1. Maîtriser les fonctionnalités d'une architecture informatique robuste pour le stockage et le traitement distribué des données.
C1.2. Traduire un problème business en problème mathématiques/statistiques afin de définir une stratégie de valorisation des données pour exploiter les informations décisionnelles de la structure.
C1.3. Concevoir une stratégie de valorisation des données en proposant des « entrepôts de données » tenant compte de l'écosystème économique, réglementaire et des contraintes de sécurité liées au traitement des données.
C.2.1 Formuler et présenter des analyses statistiques décisionnels à viser des différents services de la structure pour les accompagner dans leur prise de décision.
C.2.2 Communiquer sur le potentiel des outils innovants de représentation, de modélisation et de visualisation pour contribuer à la plus-value et la prise de décisions utiles à la structure.
C.2.3 Dimensionner les actions du projet en définissant les choix techniques et méthodologiques des interventions pour évaluer et planifier les ressources techniques, budgétaires et humaines.
C.2.4 Communiquer sur la stratégie de valorisation des données de la structure pour sensibiliser les acteurs, accompagner au changement et améliorer le fonctionnement interne.

MODALITES D'EVALUATION:

E2 Thèse professionnelle E3 Projet en groupe E7 Mise en situation professionnelle réelle sur la réglementation, la sécurisation des données:Chaque apprenant(e) traite l'aspect règlementaire sur une problématique de l'entreprise dans laquelle il (elle) réalise son alternance

FRANCE-COMPETENCES
RNCP35197BC01

FORMATION AU BLOC :
Modéliser les données massives d'une structure

C1.1. Maitriser les outils d'analyse pour décrire les données en tenant compte du contexte.
C1.2. Identifier l'outil de modélisation statistique en fonction du type de donnée, structurée ou non structurée, afin de la traiter.
C1.3. Effectuer l'analyse exploratoire et la description des masses de données au travers d'une méthode statistique pour déterminer les problématiques de description, de projection, de visualisation et de regroupement des données en catégories homogènes.
C2.1. Sélectionner une méthodologie de traitement statistique au regard du problème posé, du type de donnée pour la modéliser.
C2.2. Concevoir et réaliser un prototype du modèle à partir de logiciels de programmation haut niveau pour montrer la faisabilité et la pertinence du modèle.
C2.3. Evaluer la performance du modèle au regard des contraintes de mise en production pour le mettre en oeuvre.

MODALITES D'EVALUATION:

E1 Mise en situation professionnelle reconstituée d'analyse de données publiquement disponibles : chaque candidat réalise un support (code, rapport) de son modèle d'analyse exploratoire et de représentation des données E2 Thèse professionnelle E3 Projet en groupe E4 : QCM de 10 questions sur les concepts théoriques et pratiques.Exemple de thématiques: modèle SVM et Bayes modèle d'apprentissage supervisé vs non supervisé modèle convolutif et récurrent (IA) optimisation

FRANCE-COMPETENCES
RNCP35197BC02

FORMATION AU BLOC :
Collecter, structurer et traiter les données d'une structure

C1.1. Maitriser et utiliser les outils d'interrogation des bases de données pour extraire et collecter les données.
C1.2. Concevoir un système d'ingénierie de données en définissant une approche méthodologique de collecte, de stockage et d'interrogation pour l'analyse de masse de données réelles.
C2.1. Elaborer et mettre en place une stratégie de traitement distribué en ligne ou hors ligne de la donnée structurée et non structurée par un langage de programmation fonctionnel afin de les exploiter.
C2.2. Développer des implémentations au regard des données à traiter pour cadrer les algorithmes et performances prédictives.
C3.1. Analyser les retours pour mettre à jour l'exploitation et le stockage des données.
C3.2. Repérer le type de problème rencontré, d'apprentissage ou de fouille de données, en utilisant des algorithmes d'optimisation pour le résoudre.

MODALITES D'EVALUATION:

E2 Thèse professionnelle E3 Projet en groupe E5 : Mise en situation professionnelle reconstituée sur le stockage de la donnée:Chaque candidat réalise la conception, la configuration et l'implémentation de systèmes de stockage de la donnée via des outils d'interrogation des bases de données et à partir de données publiquement disponibles. E6 : Mise en situation professionnelle reconstituée portant sur l'architecture de traitement distribuée de données:Chaque candidat conçoit et réalise une architecture de traitement distribuée des données à partir de données publiquement disponibles.