Toujours intéressant de voir comment les autres travaillent... Tu connais peut-être ces deux articles intéressants pour réfléchir à la meilleure organisation des projets : ro.uow.edu.au/cgi/viewcontent.cgi?article=6445&context=smhpapers dx.plos.org/10.1371/journal.pcbi.1000424 Pour ma part çà évolue au cours du temps. Je sépare maintenant les données dans des dossiers data_raw et data_clean avec un script de nettoyage qui permet de faire passer les données (souvent pourries) de l’un à l’autre (avec parfois un rapport indiquant les tests de validité effectués). Souvent on a besoin de partager que les données propres (data_clean) et le script d’analyse et moins le processus fastidieux de nettoyage. J’ai aussi parfois un dossier data supplémentaire avec les données confidentielles (adresses, noms, localisations) pour éviter toute fuite. Je ne sépare pas les scripts de la documentation (pas de R + Rmd). Je génère directement mes rapports pdf depuis le script R avec knitr::spin (ou ctrl+Alt+K dans Rstudio). Pour les figures, j’active l’option par défaut de knitr cache = TRUE ce qui permet de sauver automatiquement tous les graphiques et je demande un format pdf et png pour chaque graphique pour avoir à la fois un vectoriel et un bitmap : kintr ::opts_chunk$set(cache = TRUE, dev = c("cairo_pdf", "png"))
Une remarque sur le son : il y a un bruit de fond sourd quand tu tapes au clavier (par exemple). Je suppose que le micro n'est pas suspendu, il reçoit les vibrations.
Ohlala mais pourquoi est-ce que je découvre ta chaîne seulement maintenant ?!
Génial ! Je commence à faire du machine learning et ça m’aide à comprendre ! Et à m’organiser
Cette vidéo : quand les statisticiens découvrent l'organisation informatique ;-))
mieux vaut tard que jamais ^^
Toujours intéressant de voir comment les autres travaillent...
Tu connais peut-être ces deux articles intéressants pour réfléchir à la meilleure organisation des projets :
ro.uow.edu.au/cgi/viewcontent.cgi?article=6445&context=smhpapers
dx.plos.org/10.1371/journal.pcbi.1000424
Pour ma part çà évolue au cours du temps. Je sépare maintenant les données dans des dossiers data_raw et data_clean avec un script de nettoyage qui permet de faire passer les données (souvent pourries) de l’un à l’autre (avec parfois un rapport indiquant les tests de validité effectués). Souvent on a besoin de partager que les données propres (data_clean) et le script d’analyse et moins le processus fastidieux de nettoyage. J’ai aussi parfois un dossier data supplémentaire avec les données confidentielles (adresses, noms, localisations) pour éviter toute fuite.
Je ne sépare pas les scripts de la documentation (pas de R + Rmd). Je génère directement mes rapports pdf depuis le script R avec knitr::spin (ou ctrl+Alt+K dans Rstudio).
Pour les figures, j’active l’option par défaut de knitr cache = TRUE ce qui permet de sauver automatiquement tous les graphiques et je demande un format pdf et png pour chaque graphique pour avoir à la fois un vectoriel et un bitmap : kintr ::opts_chunk$set(cache = TRUE, dev = c("cairo_pdf", "png"))
Une remarque sur le son : il y a un bruit de fond sourd quand tu tapes au clavier (par exemple).
Je suppose que le micro n'est pas suspendu, il reçoit les vibrations.
oui j'apprends encore à éditer mes vidéos et faire un bon son. C'est quelque chose pour lequel je suis nettement moins compétent que R ^^