1. Grâce à ce formulaire vous pouvez proposer une astuce ou un script sur R.
  2. Votre script doit pouvoir être lancé en l'état. Veuillez penser à :
    • inclure le chargement des "library" nécessaires
    • construire un petit jeu de données si besoin est.
    • commenter les lignes de codes pour en faciliter la compréhension.
  3. Le titre de votre script ou astuce doit être clair et explicite.
  4. Pensez à mettre votre code entre les balises [R] et [/R]; Pour cela, vous pouvez utiliser le bouton

Vous pouvez utiliser vos comptes Facebook, twitter ou google pour vous identifer (google est compatible yahoo, openID...)
L'ideal étant de vous connecter si vous avez un compte utilisateur, ou faire une demande de compte utilisateur si vous n'en avez pas encore.
Créer un compte va vous permettre de pouvoir éditer vos codes et de mettre en avant votre site internet.
Sinon vous pouvez soumettre anonymement en remplissant les champs ci-après.







Choisissez les catégories correspondantes à votre Code:

  • algorithmique
  • Analyse de survie
  • base indispensable
  • bayésien
  • configuration de R
  • exportation de données
  • fonctions utiles
  • graphique
  • importation de données
  • inférence
  • manipulation de données
  • message d'erreur
  • modélisation
  • Non classé
  • optimisation
  • planification
  • programmer avec R
  • regression linéaire
  • Test
  • tidyverse
  • Transformation de données


tidyverse

Comment sélectionner des colonnes qui commencent par une suite de caractères ? select( starts_with())

0
dans manipulation de données, tidyverse
- ça ne sert à rien -- c\'est interessant - (pas encore de vote)
Loading ... Loading ...

Vous avez besoin de sélectionner des colonnes en fonction de leur nom ? Faites appel à select, fonction du package dplyr. Vous trouvez laborieux de taper à la main l’ensemble des noms des colonnes que vous souhaitez ? Il y a un paramètre pour ça !

Si vos noms de colonnes suivent un pattern défini, vous pouvez les sélectionner avec starts_with().

library(dplyr)
data("who")
select(who, starts_with("newrel"))

À noter que vous pouvez également utiliser ends_with(), matches() ou encore contains().

Pas encore de commentaire, cliquez ici pour réagir.

Comment rédiger avec RMarkdown ? Quelques commandes utiles

0
dans programmer avec R, tidyverse
- ça ne sert à rien -- c\'est interessant - (pas encore de vote)
Loading ... Loading ...

Vous souhaitez rédiger des documents qui contiennent du code, des résultats de console ou des graphiques ? Alors Mardown est fait pour vous !

Langage HTML simplifié, Markdown est idéal pour communiquer, à toutes les étapes de votre analyse de données. Carnets de notes pour vous, outils de transmission à vos collègues, ou encore bilans d’analyse à destination d’un grand public, les documents Markdown sont un véritable atouts, à mettre dans la besace de tous les utilisateurs de R. Et pour cause, sa simplicité va vous bluffer !

Pour créer un nouveau document en RMarkdown, rendez-vous sur l’onglet « File / New File » de RStudio. Puis, sélectionnez « R Markdown ». Dans cette nouvelle fenêtre, vous pouvez rédiger votre présentation, en suivant les conventions de balisage suivantes :

 # Titre de niveau 1
## Titre de niveau 2
### Titre de niveau 3
#### Titre de niveau 4 
 
_Un texte en italique_
__Un texte en gras__
 
[Un lien vers](www.ce-site.com)
![Une image située](à/cet/emplacement.png) 
 
> Une citation
 
* Une liste
* avec plusieurs items
 + et des sous-items
 
```{r}
Une portion de code R 
```

Et pour en savoir plus sur les commandes, rendez-vous sur la Cheatsheet officielle !

Pas encore de commentaire, cliquez ici pour réagir.

Comment créer un diagramme circulaire avec ggplot2 ? coord_polar()

0
dans graphique, tidyverse
- ça ne sert à rien -- c\'est interessant - (pas encore de vote)
Loading ... Loading ...

Vous en avez assez des digrammes en barres et des lignes ? Alors laissez-vous tenter par les diagrammes circulaires !

Pour transformer votre graphe en diagramme circulaire, ajoutez l’argument coord_polar() à votre ggplot !

library(ggplot2)
data(diamonds)
ggplot(diamonds, aes(cut)) + 
  geom_bar() + 
  coord_polar()
Pas encore de commentaire, cliquez ici pour réagir.

Comment sélectionner des lignes par leur index ? slice()

0
dans manipulation de données, tidyverse
- ça ne sert à rien -- c\'est interessant - (pas encore de vote)
Loading ... Loading ...

Pour sélectionner une série de lignes d’un tableau par leur index, faites appel à la fonction slice() du package dplyr !

Comme tous ses cousins du tidyverse, slice() prend en premier argument le nom du tableau à transformer. Ensuite, vous pouvez sélectionner vos lignes par leur index, avec un vecteur numérique.

library(dplyr)
data("presidential")
slice(presidential, 1:25)
Pas encore de commentaire, cliquez ici pour réagir.

Comment changer l’échelle d’un axe contenant une date dans ggplot2 ? scale_x_date(break)

0
dans graphique, tidyverse
- ça ne sert à rien -- c\'est interessant - (pas encore de vote)
Loading ... Loading ...

Vous souhaitez ne garder que les mois, ou uniquement les années sur votre ggplot ? Vous avez envie de changer le format des étiquettes de l’axe ? Pour cela, direction la fonction scale_x_date(), qui vous permettra de personnaliser votre axe comme vous le souhaitez !

Dans la majorité des cas, vous serez amené à utiliser deux arguments principaux sur scale_x_date (mais il faut savoir qu’il en existe au total 9) :

  • date_breaks, pour la durée entre chaque point principal de l’axe
  • date_label, pour définir le formatage de l’affichage de la légende
library(tidyverse)
library(ggplot2)
library(nycflights13)
data %
  unite(date, year, month, day, sep = "-") %>%
  mutate(date = lubridate::ymd(date)) %>%
  group_by(date) %>%
  summarise(count = n())
ggplot(data, aes(date, count)) + 
  geom_line() +
  scale_x_date(date_breaks = "2 months", date_labels = "%b")

À noter que cette fonction s’adapte aux différents formats de date de votre jeu de données, ainsi qu’à l’axe que vous souhaitez modifier — scale_y_date, scale_x_datetime, scale_y_datetime, scale_x_time, scale_y_time.

Pas encore de commentaire, cliquez ici pour réagir.

Comment changer l’emplacement de la légende avec ggplot2 ? theme(legend.position)

0
dans graphique, tidyverse
- ça ne sert à rien -- c\'est interessant - (pas encore de vote)
Loading ... Loading ...
Vous n’avez plus envie de voir vos légendes sur la droite ? Vous mourrez d’envie de pouvoir personnaliser encore plus votre graphique ? Faites appel à la fonction theme(), et à son argument legend.position — ce dernier vous permet de placer la légende sur le bord que vous désirez.
library(ggplot2)
data("iris")
ggplot(iris, aes(x= Sepal.Length, y = Sepal.Width, col = Species)) + 
  geom_point() + 
  theme(legend.position = "bottom")
Les cinq arguments possibles sont les quatre bords, ainsi que la position none, pour faire disparaitre la légende.
theme(legend.position = "left")
theme(legend.position = "right")
theme(legend.position = "bottom")
theme(legend.position = "top")
theme(legend.position = "none")
Pas encore de commentaire, cliquez ici pour réagir.

Comment joindre plusieurs colonnes en une ? unite()

0
dans tidyverse, Transformation de données
- ça ne sert à rien -- c\'est interessant - (pas encore de vote)
Loading ... Loading ...

Si vous souhaitez unifier plusieurs colonnes en une seule, faites appel à la fonction unite(), issue du package tidyr.

Cette fonction prends en premier argument le nom de l’objet contenant le tableau, la colonne cible, les colonnes à lier, puis un éventuel séparateur. Notez que le séparateur de base est « _ ».

data("msleep")
library(tidyr)
unite(msleep, genusvore, genus, vore, sep = "-")
Pas encore de commentaire, cliquez ici pour réagir.

Comment séparer une colonne ? separate()

0
dans manipulation de données, tidyverse
- ça ne sert à rien -- c\'est interessant - (pas encore de vote)
Loading ... Loading ...

Votre colonne contient deux variables (ou plus), et vous avez besoin de la séparer ? Pour transformer xx_yy en deux colonnes qui contiendront xx et yy, faites appel à la fonction separate() du package tidyr !

separate prend quatre arguments principaux : le tableau, le nom de la colonne à séparer, les noms des colonnes cibles, et le séparateur.

library(tidyr)
data("presidential")
separate(presidential, start, c("y","m", "d"), sep = "-")
Pas encore de commentaire, cliquez ici pour réagir.

Tibble ou data.frame ?

0
dans manipulation de données, tidyverse
- ça ne sert à rien -- c\'est interessant - (pas encore de vote)
Loading ... Loading ...

Commençons par un point important : un tibble est un data.frame… mais un data.frame amélioré !

Élément central du tidyverse, cette forme diffère des data.frame natifs dans deux comportements :

  • l’affichage : les tibbles s’adaptent à l’écran, et chaque colonne affiche son type.
  • la sélection : elle est plus stricte dans un tibble — elle ne se fait jamais en partial match, et un message d’erreur s’affiche lorsque vous sélectionner un élément qui n’existe pas.
Pour créer un tibble, deux solutions : la conversion depuis un data.frame, ou la création à la main.
library(tibble)
data("swiss")
as_tibble(swiss)
 
tibble(x = 1:4, 
       y = 5:8)
Pas encore de commentaire, cliquez ici pour réagir.

Comment gérer les titres de mon graphe ggplot ? labs()

0
dans graphique, tidyverse
- ça ne sert à rien -- c\'est interessant - (pas encore de vote)
Loading ... Loading ...
La fonction labs(), à utiliser pendant la construction de votre ggplot, vous permet d’intégrer titre, sous-titres, et légendes.
ggplot(iris, aes(Sepal.Width, Sepal.Length)) +
  geom_point() + 
  labs(title = "Mon titre", 
       subtitle = "Mon sous titre \n sur deux lignes", 
       caption = "Ma légende", 
       x = "Mon axe x",
       y = "Mon axe y")
Pas encore de commentaire, cliquez ici pour réagir.
Formation logiciel R