+ - 0:00:00
Notes for current slide
Notes for next slide

Quelques ressources R et Python utiles pour s’autoformer

Rencontres Spyrales

Lino Galiana, Olivier Chantrel

Insee, MTES

30 novembre 2021

1 / 9

Enjeu

Pourquoi ne pas se contenter des documentations existantes ?

1. Cibler les ressources pertinentes

  • Eclatement de la documentation des écosystèmes R et Python ;
  • Barrière linguistique : la grande majorité de la documentation est en anglais ;
  • Niveaux hétérogènes

2 / 9

Enjeu

Pourquoi ne pas se contenter des documentations existantes ?

1. Cibler les ressources pertinentes

  • Eclatement de la documentation des écosystèmes R et Python ;
  • Barrière linguistique : la grande majorité de la documentation est en anglais ;
  • Niveaux hétérogènes

2. Bénéficier de l'expérience d'utilisateurs :

  • Diversité des cas d'usage de R ou Python dans le service public ;
  • Multiplicité de packages, de qualité variable et parfois redondants ;
  • Utiliser un langage pour un projet statistique n'implique pas les mêmes pratiques que pour un projet d'application
2 / 9

Panorama incomplet des ressources disponibles (1/2)

1. Modules d'autoformation sur sspcloud.fr/documentation;

  • Notebooks pédagogiques, différents niveaux accessibles
  • Environnements normalisés: pas de problèmes d'installation de packages
  • Formation aux bonnes pratiques: modularité, contrôle de version, stockage séparé du code
  • Funcamp pour découvrir sous forme ludique R (avec des missions à la Zelda)

3 / 9

Panorama incomplet des ressources disponibles (1/2)

1. Modules d'autoformation sur sspcloud.fr/documentation;

  • Notebooks pédagogiques, différents niveaux accessibles
  • Environnements normalisés: pas de problèmes d'installation de packages
  • Formation aux bonnes pratiques: modularité, contrôle de version, stockage séparé du code
  • Funcamp pour découvrir sous forme ludique R (avec des missions à la Zelda)

2. Ressources Python (et Git ):

3 / 9

Panorama incomplet des ressources disponibles (1/2)

3. Ressources R (et Git ):

4 / 9

Panorama incomplet des ressources disponibles (1/2)

3. Ressources R (et Git ):

Panorama incomplet des ressources disponibles (2/2)

4. La documentation collaborative et open-source utilitR 🔍:

  • Née à l'Insee, le public visé est plus large (tout utilisateur de données avec R) ;
  • Couvrir des cas d'usage courants des utilisateurs de données ;
  • A venir un guide des bonnes pratiques R et Python orienté projet de données ;
  • Déjà plus de 25 contributeurs, rejoignez-nous !
4 / 9

Ressources : cours de l'ENSAE

https://linogaliana-teaching.netlify.app/ (dépôt )

Un cours complet pour la data-science :

  • Manipulation et structuration de données ;
  • Visualisation ;
  • Modélisation (économétrie et machine learning) ;
  • Données textuelles (NLP) ;
  • Git et Github .

5 / 9

Ressources : cours de l'ENSAE

https://linogaliana-teaching.netlify.app/ (dépôt )

Introduire à la philosophie de la data-science :

  • Reproductibilité et pérennité des projets
  • Versioning et partage des codes
  • Réduction des coûts de mise en prod

6 / 9

Ressources : cours de l'ENSAE

https://linogaliana-teaching.netlify.app/ (dépôt )

Introduire à la philosophie de la data-science :

  • Reproductibilité et pérennité des projets
  • Versioning et partage des codes
  • Réduction des coûts de mise en prod

Mise à disposition tutoriels et exercices facilitée:

Page en question: https://linogaliana-teaching.netlify.app/webscraping/

6 / 9

Ressources : utilitR

https://www.utilitr.org/ (dépôt )

1. Un positionnement différent par rapport à une formation:

  • Approche par les cas d'usage ;
  • Recommandations et conseils issus de débats sur Github ;
  • Point d'entrée avec de nombreuses références;

2. Une documentation complète pour statisticiens/data-scientists ;

  • Tout est disponible sur https://www.utilitr.org
  • Bientôt un guide des bonnes pratiques
  • Aussi des éléments sur Git.


Rejoignez l'équipe des contributeurs !

7 / 9

Ressources : le portail MTES

https://mtes-mct.github.io/parcours-r/ (dépôt )

Un portail d'(auto)formation avec une grande diversité de modules:

  • Modules introductifs (modules "socle"): intro à la programmation, analyse de données
  • Modules thématiques (modules "à la carte"): datavisualisation, RMarkdown, analyse spatiale...

8 / 9

Ressources : le portail MTES

https://mtes-mct.github.io/parcours-r/ (dépôt )

Retour d'expérience:

  • 120 agents formés en 2021 via le parcours R ;
  • Une vingtaine de formateurs du MTE ;
  • Une petite dizaine d’agents produisent les supports ;
  • Des formations dispensées principalement à distance ;
  • Et des formations avancées dispensées à quelques agents par un prestataire extérieur.

9 / 9

Ressources : le portail MTES

https://mtes-mct.github.io/parcours-r/ (dépôt )

Retour d'expérience:

  • 120 agents formés en 2021 via le parcours R ;
  • Une vingtaine de formateurs du MTE ;
  • Une petite dizaine d’agents produisent les supports ;
  • Des formations dispensées principalement à distance ;
  • Et des formations avancées dispensées à quelques agents par un prestataire extérieur.

Une stratégie plus globale:

9 / 9

Enjeu

Pourquoi ne pas se contenter des documentations existantes ?

1. Cibler les ressources pertinentes

  • Eclatement de la documentation des écosystèmes R et Python ;
  • Barrière linguistique : la grande majorité de la documentation est en anglais ;
  • Niveaux hétérogènes

2 / 9
Paused

Help

Keyboard shortcuts

, , Pg Up, k Go to previous slide
, , Pg Dn, Space, j Go to next slide
Home Go to first slide
End Go to last slide
Number + Return Go to specific slide
b / m / f Toggle blackout / mirrored / fullscreen mode
c Clone slideshow
p Toggle presenter mode
t Restart the presentation timer
?, h Toggle this help
Esc Back to slideshow