Aide à la programmation, réponses aux questions / r / R: extraire des lignes et des colonnes spécifiques de dataframe - r

R: extraire des lignes et des colonnes spécifiques de dataframe - r

J'essaie de simplifier un script que j'utilise pour extraire des lignes et des colonnes spécifiques d'un grand bloc de données et les placer dans un autre afin de pouvoir ensuite tracer un graphique. Jusqu'à présent, j'ai utilisé un for boucle pour obtenir des bits à la fois, puis rbind() ensemble, mais je pense qu’il doit y avoir une meilleure solution. Espérons que je pourrai illustrer ce que j’ai essayé de faire à titre d’exemple représentatif:

a <- rep(1:8, each=40)
b <- rep(rep(1:4, each=5), times=16)
c <- runif(320)
d <- runif(320)

df <- data.frame(a,b,c,d)

Ce que je voudrais faire, c’est d’extraire ces colonnes de valeurs spécifiques de a et b. J'ai donc pensé, par exemple, à sortir des lignes où a est 1 ou 2, je pourrais le faire avec quelque chose comme:

extract.a = c(1,2)
extractcolumns = c("a", "b", "c", "d")
extracted <- df[a == extract.a, extractcolumns]

(Je suis parti dans le extractcolumns peu, même si je n’en ai pas besoin dans ce cas, mais dans le cas réel, je veux prendre 5 colonnes sur 17). Le problème est ce genre de travaux, mais prend seulement tous les deux Exemple,

extract.a = c(1,2,4)

Ensuite, il faut chaque troisième rangée. Je ne suis pas sûr de savoir exactement ce que ça fait ici, alors je suis bloqué sur la façon de le réparer. Ce que je voudrais faire en fin de compte, c’est de sélectionner des lignes où a est l'une de plusieurs valeurs et b est également l'une des deux valeurs. Quelque chose comme:

 extract.b = c(1,4)
extracted <- df[a == extract.a & b == extract.b, extractcolumns]

... mais évidemment ce n’est pas correct non plus. Cela fonctionne, par exemple:

 extracted <- df[(a == 1 | a == 2 | a == 4) & (b == 1 | b == 3), extractcolumns]

Mais j’aimerais pouvoir définir les valeurs de a et b, je voudrais un autre endroit, comme je l’ai fait plus haut.

J'espère que c'est assez clair!

Réponses:

1 pour la réponse № 1

La solution consiste à utiliser le %in% opérateur au lieu de == qui peut effectuer un plusieurs Comparaison

df[a %in% extract.a & b %in% extract.b, extractcolumns]

questions connexes

Comment sélectionner une plage de colonnes dans une base de données en fonction de leur nom et non de leurs index? - r, dataframe, sous-ensemble, conversion de code

Comment découper un cadre de données en sélectionnant une plage de colonnes et de lignes en fonction de noms et non d'index? - r, dataframe, sous-ensemble, tranche

Comment multiplier une colonne en plusieurs colonnes multiples dans Python DataFrame - python, dataframe, multiplier

Meilleure façon d'éliminer les colonnes avec une seule valeur de pandas dataframe - python, pandas

Fractionnement des cellules dans un pandas DataFrame par des espaces - python, pandas, split, transformation

Comportement étrange de Pandas DataFrame - python, pandas, dataframe

Suppression des zéros d'une colonne avec pandas et matplotlib - python, pandas, numpy, matplotlib, conversion de données

Trouvez les valeurs communes dans les colonnes de la base de données Pandas - python, pandas

Rejoindre 3 cadres de données panda - python, pandas, join

Python: sélectionnez plusieurs colonnes dans une image de données à partir d'une autre image de données sans boucle - python, pandas

créer des données de pandas à partir de 27 millions de lignes - python, pandas, dataframe

comment préserver l'identité du cadre de données des pandas lors de l'extraction d'une seule ligne

Python Pandas Définition de l'index Dataframe et des noms de colonne d'un tableau - python, pandas

Comment sélectionner des colonnes fortement corrélées avec une colonne spécifique dans un dataframe - python, pandas, corrélation, tableau

Extraction de toutes les lignes de pandas Dataframe ayant une certaine valeur dans une colonne spécifique - python, pandas, dataframe

Existe-t-il un meilleur moyen de calculer la moyenne d'une ligne dans un DataFrame de pandas? - python, pandas

Remplacement des colonnes d'un cadre de données par des colonnes provenant d'un autre cadre de données dans les pandas - python-3.x, pandas

Concaténer une trame de données comportant un nombre différent de lignes - pandas, trame de données

tracer une ligne de données pandas ligne par ligne - pandas, matplotlib

Comment utiliser un tableau de noms de colonnes en agassant une ligne de structure de données dans la fonction map et créer un nouveau fichier DF - apache-spark, apache-spark-sql, spark-dataframe