/ / comment encoder la colonne de données pandas python - python, pandas, numpy, statistiques

comment encoder les pandas de la colonne de données - python, pandas, numpy, statistiques

J'ai un ensemble de données avec la colonne suivante:

Aperçu des données

Comme le montre l'image, le niveau 1 est univariétandis que le niveau 2 est bivarié et le niveau 3 est multivarié. Le niveau 3 peut se répéter pour différents niveaux 2. Comment puis-je coder ces variables ensemble dans des pandas, de sorte que Ingrédients + aliments + contenant colonnes est combiné à une catégorie?

Je souhaite analyser quel fournisseur propose des produits à prix avantageux.

Réponses:

0 pour la réponse № 1

Je crois que tu as besoin factorize avec joint toutes les colonnes ensemble:

df["new"] = pd.factorize(df["Level 1"] + df["Level 2"] + df["Level 3"])[0]