Mám súbor údajov, ktorý už bol importovaný do súboru R, ktorý obsahuje 12 premenných, ale zdá sa, že nemôžem nájsť veľa informácií o tom, ako filtrovať svoju množinu údajov pre každú premennú.
Jednou z týchto premenných je napríklad "Sex", ktorá má dve hodnoty: "M" a "F". Zaujímam sa o čiastkové súbory údajov, ktoré filtrovali pôvodnú množinu údajov s oboma pohlaviami, a to len pre mužov a ženy.
Ďalším príkladom je rok narodenia: Roky narodenia v údajoch sa budú pohybovať v rokoch 1800 až 2007, ale zaujímame sa o roky narodenia, ktoré sú neskôr (Rok narodenia> 1990).
Čo je to jednoduchý a jednoduchý spôsob, ako to urobiť? Je to podobné ako SAS (čo je len niekoľko vyhlásení)?
odpovede:
0 pre odpoveď č. 1Prijal som riešenie môjho problému prostredníctvom profesora. Tu je kód, ktorý pomáha s týmto, musíte nainštalovať balík "dplyer" v R.
install.packages ( "dplyr")
knižnica (dplyr)
modified_dataset <- tbl_df (súbor údajov)
Príklad "filtrovania", tento len požiada o sadu údajov Male, namiesto celej množiny údajov
filter (modifikovaný_dataset, Sex == "M")
vyberte (filter (modified_dataset, Sex == "M"), Name, atď.)
only_Male <- modified_dataset%>% filter (Sex == "M")%>% vyberte (Názov, Fed)
Tento formát vám prináša nový súbor údajov založený na podmienkach, ktoré požadujete.