R Sorter en dataramme ved å bestille ()

Innholdsfortegnelse:

Anonim

I dataanalyse kan du sortere dataene dine etter en bestemt variabel i datasettet. I R kan vi bruke hjelp av funksjonsrekkefølgen (). I R kan vi enkelt sortere en vektor av kontinuerlig variabel eller faktorvariabel. Ordningen av data kan være av stigende eller synkende rekkefølge.

Syntaks:

sort(x, decreasing = FALSE, na.last = TRUE):

Argument:

  • x : En vektor som inneholder kontinuerlig eller faktorvariabel
  • synkende : Kontroll for rekkefølgen på sorteringsmetoden. Som standard er reduksjon satt til `FALSE`.
  • siste : Indikerer om NA-verdien skal settes sist eller ikke

Eksempel 1

For eksempel kan vi lage en tibble dataramme og sortere en eller flere variabler. En tibble dataramme er en ny tilnærming til datarammen. Det forbedrer syntaksen til datarammen og unngår frustrerende datatypeformatering, spesielt for karakter til faktor. Det er også en praktisk måte å lage en dataramme for hånd, som er vårt formål her. For å lære mer om tibble, se vignetten: https://cran.r-project.org/web/packages/tibble/vignettes/tibble.html

library(dplyr)set.seed(1234)data_frame <- tibble(c1 = rnorm(50, 5, 1.5),c2 = rnorm(50, 5, 1.5),c3 = rnorm(50, 5, 1.5),c4 = rnorm(50, 5, 1.5),c5 = rnorm(50, 5, 1.5))# Sort by c1df <-data_frame[order(data_frame$c1),]head(df)

Produksjon:

# A tibble: 6 x 5## c1 c2 c3 c4 c5##     ## 1 1.481453 3.477557 4.246283 3.686611 6.0511003## 2 1.729941 5.824996 4.525823 6.753663 0.1502718## 3 2.556360 6.275348 2.524849 6.368483 5.4787404## 4 2.827693 4.769902 5.120089 3.743626 4.0103449## 5 2.988510 4.395902 2.077631 4.236894 4.6176880## 6 3.122021 6.317305 5.413840 3.551145 5.6067027

Eksempel 2

# Sort by c3 and c4df <-data_frame[order(data_frame$c3, data_frame$c4),]head(df)

Produksjon:

# A tibble: 6 x 5## c1 c2 c3 c4 c5##     ## 1 2.988510 4.395902 2.077631 4.236894 4.617688## 2 2.556360 6.275348 2.524849 6.368483 5.478740## 3 3.464516 3.914627 2.730068 9.565649 6.016123## 4 4.233486 3.292088 3.133568 7.517309 4.772395## 5 3.935840 2.941547 3.242078 6.464048 3.599745## 6 3.835619 4.947859 3.335349 4.378370 7.240240

Eksempel 3

# Sort by c3(descending) and c4(acending)df <-data_frame[order(-data_frame$c3, data_frame$c4),]head(df)

Produksjon:

# A tibble: 6 x 5## c1 c2 c3 c4 c5##     ## 1 4.339178 4.450214 8.087243 4.5010140 8.410225## 2 3.959420 8.105406 7.736312 7.1168936 5.431565## 3 3.339023 3.298088 7.494285 5.9303153 7.035912## 4 3.397036 5.382794 7.092722 0.7163620 5.620098## 5 6.653446 4.733315 6.520536 0.9016707 4.513410## 6 4.558559 4.712609 6.380086 6.0562703 5.044277