Aide à la programmation, réponses aux questions / Python / numpy / pandas confusion de différence NaN - python, pandas, numpy

numpy / pandas confusion de différence NaN - python, pandas, numpy

Je suis tombé sur cela en essayant de trouver les moyens / sommes d’éléments non-nan dans les rangées d’un pandas trame de données. Il paraît que

df.apply(np.mean, axis=1)

fonctionne bien

Cependant, en appliquant np.mean à un numpy tableau contenant nans renvoie un nan.

Est-ce que tout cela est spécifié quelque part? Je ne voudrais pas être brûlé sur la route ...

Réponses:

2 pour la réponse № 1

La fonction moyenne de numpy vérifie d’abord si son entrée a une méthode moyenne, comme l'explique @EdChum dans cette réponse.

Lorsque vous utilisez df.apply, l’entrée passée à la fonction est un pandas.Series. Puisque pandas.Series a une méthode moyenne, numpy l’utilise au lieu d’utiliser sa propre fonction. Et par défaut, pandas.Series.mean ignore NaN.

Vous pouvez accéder au tableau numpy sous-jacent par l'attribut values et le transmettre à la fonction:

df.apply(lambda x: np.mean(x.values), axis=1)

cela utilisera la version de numpy.

1 pour la réponse № 2

Divakar a correctement suggéré d'utiliser np.nanmean

Si je peux répondre à la question toujours en suspens, la sémantique diffère parce que Numpy prend en charge les tableaux masqués, tandis que Les pandas ne le font pas.

questions connexes

Pip installer Numpy Errors - python, pandas, numpy, pip

Comment convertir une série chronologique de pandas en un tableau numpy du temps total écoulé? - python, pandas, numpy

Construire des pandas pour pypy - python, pandas, pypy

pandas distinction entre str et types d'objet - python, numpy, pandas

Comment convertir une série de pandas qui est multidimensionnelle à pandas dataframe - python, pandas, numpy, dataframe

Pandas ne traçant pas correctement les données mais numpy est - python, pandas, numpy, matplotlib, scikit-learn

Pandas read_csv: convertit une chaîne spécifique en numpy.inf - python, pandas

L'objet DataFrame des pandas a-t-il remplacé les autres alternatives pour les types de données hétérogènes? - Python, numpy, scipy, pandas

Est-il possible d'installer des bibliothèques python telles que Numpy, Scipy, Pandas et Matplotlib et statsmodels dans Eclipse - python, eclipse, numpy, pandas, scipy

L’axe des pandas / numpy est-il l’opposé de la MARGE de R? - python, r, pandas, numpy

Python-opérer la matrice avec des caractères - python, numpy, types

Python - Mise à jour des pandas - Python, pandas

Puis-je exécuter numpy et pandas avec Jython - python, numpy, pandas, jython

Comment stocker un tableau numpy dans une colonne d'un dataframe Pandas? - python, python-2.7, numpy, pandas

Comment convertir une matrice numpy en une série de pandas? - python, tableaux, numpy, pandas

Panneau de pandas en tant que tableau multidimensionnel de numpy - python, pandas, panneau

Django peut-il bien travailler avec les pandas et les moqueurs? - python, django, pandas, numpy

Qu'est-ce que l'équivalent de python de NA de R? - python, numpy, pandas, scikit-learn, nettoyage des données

Faisabilité de la conversion de tous les codes Python pandas / numpy en base python - python, pandas, numpy

Comment utiliser les pandas dans le flux de données Google Cloud? - pandas, google-cloud-dataflow, apache-beam