Data science : programmation en langage R



Objectifs, programme, validation de la formation

Objectifs

Être capable, dans une démarche de data science menée par son organisation, de créer une fonction en langage R, sous forme de package, en respectant les bonnes pratiques de développement pour permettre son usage par d’autres utilisateurs dans l’environnement R

Factoriser du code pour concevoir des fonctions
Intégrer ses fonctions dans un package R
Documenter des fonctions dans les règles de l’art
Utiliser les outils de debug de fonction
Mettre en place des tests unitaires
Réussir à passer les tests de check du CRAN
Versionner son code avec git
Connaitre les bonnes pratiques de diffusion d’ un package R
Comprendre les principes de base de l’intégration continue
Découvrir la programmation fonctionnelle
Encapsuler des données

Description, programmation

Comprendre la notion de factorisation
Comprendre la notion de paramètre
Automatiser la génération de rapports Rmarkdown
Concevoir ses propres fonctions
Factoriser son code pour le réutiliser
Comprendre la notion de portée de variables
Respecter les conventions de style
Définir des paramètres par défaut
Déboguer ses fonctions
Manipuler des fichiers et des dossiers
Créer un package R
Mettre en package des fonctions simples
Utiliser devtools et usethis pour gérer les dépendances de fonctions ‘complexes’
Utiliser roxygen2 pour créer la documentation
Inclure des données dans un package
Vérifier bon fonctionnement du programme grâce aux tests unitaires
Comprendre et utiliser les tests unitaires
Choisir les bons tests
Vérifier la conformité d’un package
Auditer son package grâce aux checks du CRAN
Généraliser l’audit sur tous les systèmes d’exploitation avec rhub
Corriger les erreurs de conformité les plus fréquentes
Versionner son code avec git
Comprendre le principe de versionnage
Intégrer git dans Rstudio
Mettre en oeuvre les commandes commit, push et pull
Restaurer son projet à une version antérieure
Découvrir les principes de l’intégration continue
Comprendre les principes et enjeux de l’intégration continue
Tester automatiquement son package avec git
Publier et communiquer sur son package
Diffuser un package
Rédiger les fichiers README, NEWS, CoC ...
Découvrir la programmation fonctionnelle
Comprendre le principe de fonction pure
Itérer avec purrr

Validation et sanction

Data science : programmation en langage R ;Attestation de suivi de présence

Type de formation

Professionnalisation

Niveau de sortie sans niveau spécifique


Durée, rythme, financement

Durée 35 heures en centre
Durée indicative : 45 jours

Modalités de l'alternance FOAD : 35 h

Conventionnement Non

Conditions d'accès

Niveau d'entrée niveau III (BTS, DUT)

Conditions spécifiques et prérequis Être utilisateur quotidien ou hebdomadaire de R. Savoir compiler un document RMarkdown dans un projet RStudio. Avoir un niveau équivalent la certification analyse de données avec R.

Inscription

Contact renseignement Mme Diane Beldame

Téléphone 01 85 09 14 03


Éligibilité de cette formation au compte personnel de formation pour les salariés


Code CPF 328447 - Validité du 01/02/2020 au 31/12/2115


Périodes prévisibles de déroulement des sessions

Session débutant le : 15/03/2022

Adresse d'inscription
50 Rue Arthur Rimbaud 93300 Aubervilliers

Lieu de formation


Organisme de formation responsable