06-manipulate.Rmd

# Manipuler les données dans R

## Sélection de colonnes d’un tableau

Afficher les noms des colonnes

```{r}
colnames(exprs)
```

Valeurs stockées dans la colonne nommée "WT1"

```{r}
exprs$WT1
```

Notation alternative

```{r}
exprs[ , "WT1"]
```

Sélection de plusieurs colonnes. 

```{r}
exprs[ , c("WT1", "WT2")]
```

Sélection de colonnes par leur indice

```{r}
exprs[ , 2]
```

```{r}
exprs[ , c( 3, 2)]
```

## Sélection de lignes d’un tableau

Sélection des lignes 4 et 11 du tableau des expressions

```{r}
exprs[c(4, 11), ]
```

Sélection des identifiants de deux gènes d’intérêt

```{r}
my_genes <- c("ENSG00000253991", "ENSG00000099958")
```

Vecteur booléen indiquant si chaque ID du tableau fait partie des gènes d’intérêt
```{r}
exprs$id %in% my_genes
```

Indices des lignes correspondant aux IDs des gènes d’intérêt
```{r}
which(exprs$id %in% my_genes)
```

Afficher les lignes correspondantes
```{r}
exprs[which(exprs$id %in% my_genes),   ]
```

## Formulation plus intuitive
```{r}
subset(x = exprs, id %in% my_genes)		
```

Approche plus moderne, avec le package dplyr

```{r}
## charger la librairie dplyr
library(dplyr)	
```

```{r}
## envoyer le tableau exprs à la commande filter()
exprs %>% filter(id %in% my_genes)	
```

```{r}
## plus avancé : enchaîner plusieurs commandes
exprs %>% 
  filter(id %in% my_genes) %>% 
  mutate(mean_KO = (KO1 + KO2)/2)	
```