Collecte de données liées à l'obésité humaine

Ce projet nécessite d'avoir assimilé l'ensemble des notions des cinq premiers modules du cours de science des données biologiques 1. Il correspond au dépôt GitHub https://github.com/BioDataScience-Course/A04Ga_biometry. Il est distribué sous licence CC BY-NC-SA 4.0.

Objectifs

Ce projet est à réaliser par groupe de quatre étudiants, avec la partie définition du protocole et collecte des données commune à toute la classe. Il doit vous permettre de démontrer les compétences suivantes :

définir un protocole d'expérience
collecter des données et les encoder correctement
se sensibiliser à la précision des mesures et à l'intercalibration
rédiger un dictionnaire des données
respecter la vie privée (RGPD) via la pseudonymisation des données
remanier un tableau de données
(en option) réaliser et interpréter des graphiques et des tableaux

Consignes

Partagez-vous le travail et effectuez bien les commits relatifs à la partie que vous avez réalisée : vos enseignants regarderont l'historique des commits pour vérifier la répartition du travail et noteront en fonction de cela. Un étudiant ayant moins contribué n'aura donc pas la même note qu'un autre qui aura fait plus de travail. Décidez d'une répartition du travail au sein de l'équipe dès le début. Par contre à la fin, vérifiez les résultats de tout le monde. L'ensemble de l'équipe est responsable de la totalité du travail. Vous devez vous mettre d'accord entre vous à la fin sur le document dans son intégralité.

Il n'y a pas de tests ici car le projet est libre et aucune réponse stéréotypée n'est donc attendue. Assurez-vous tout de même que le document Quarto compile sans erreurs à la fin, que tous les conflits éventuels dans les commits sont réglé et que la dernière version est bien dans GitHub (vérifiez directement dans GitHub après vos derniers commit-pull-push).

Ce projet est de niveau 3 et sera comptabilisé comme les projets individuels étant donné que l'essentiel du travail est réalisé de manière commune à toute la classe, il n'est pas possible de coter équipe par équipe comme pour les projets de groupes plus classiques.

Il se décompose en plusieurs phases qui s'étalent sur le module 4 et le module 5 du cours de Science des Données I.

Phase 1 (module 4)

Dans un premier temps, vous réfléchissez aux variables qu'il vous faudra employer pour déterminer l'IMC des personnes incluses dans l'étude et pour le mettre en relation avec ses caractéristiques d'une manière générale. À la fin de cette phase, vous aurez défini les mesures à réaliser et chaque étudiant collectera les données relatives à quatre individus.

Phase 2 (modules 4 & 5)

Vous allez définir un protocole permettant de pseudonymiser les données. Ensuite, vous allez encoder vos données respectives dans un fichier commun.

Cliquez sur le lien suivant pour accéder à Google Sheet et complétez le dictionnaire des données. Ce document est collectif pour l'ensemble des étudiants du cours de Science des données I.

https://docs.google.com/spreadsheets/d/1FyvoJtKkdvf5uwSASZhl_EkhzYR5033Yi2vdEnYMgFQ/edit?usp=sharing

Cliquez sur le lien suivant pour accéder à un second Google Sheet et compléter le tableau de données associé à votre expérience. L'encodage des observations n'est pas une tâche à prendre à la légère. Soyez particulièrement attentif à ne pas commettre d'erreur et à respecter le dictionnaire des données défini ci-dessus.

https://docs.google.com/spreadsheets/d/1UbaVJZzkCBAcusqWYkIZqYZoi3OSCXc89JXkA_vVDhc/edit?usp=sharing

Phase 3 (module 5)

Le dictionnaire et le tableau de données peuvent être directement importés dans R avec read$csv() et les liens suivants :

Dans le script R/import_tidy.R, importez, remaniez, ajoutez les labels et les unités et enfin, sauvegardez localement vos données nettoyées dans le dossier data/ et nommez le fichier biometry.rds (biometry_metadata.rds pour le dictionnaire des données).

Une fois votre tableau data/biometry.rds obtenu, votre travail est terminé. Cependant, et de manière optionnelle, vous pouvez commencer à explorer et décrire les données dans complétez le document bio_explo.qmd. Cela vous avancera pour le travail d'analyse de ces données que vous allez entreprendre au second quadrimestre.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
R		R
.Rbuildignore		.Rbuildignore
.gitignore		.gitignore
A04Ga_biometry.Rproj		A04Ga_biometry.Rproj
DESCRIPTION		DESCRIPTION
LICENSE		LICENSE
README.md		README.md
bio_explo.qmd		bio_explo.qmd

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Collecte de données liées à l'obésité humaine

Objectifs

Consignes

Phase 1 (module 4)

Phase 2 (modules 4 & 5)

Phase 3 (module 5)

About

Releases

Packages

Contributors 2

Languages

License

BioDataScience-Course/A04Ga_biometry

Folders and files

Latest commit

History

Repository files navigation

Collecte de données liées à l'obésité humaine

Objectifs

Consignes

Phase 1 (module 4)

Phase 2 (modules 4 & 5)

Phase 3 (module 5)

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages