У мене є набір даних з наступним стовпцем:
Як показано на зображенні, рівень 1 є одновимірнимтоді як дворівневий рівень 2 і рівень 3 багатовимірний. Там рівень 3 може повторюватися для іншого рівня 2. Як я можу кодувати ці змінні разом в пандах, так що Інгредієнти + продукти + контейнер стовпці об'єднані в одну категорію?
Я хочу проаналізувати, який постачальник надає продукти з ефективною ціною.
Відповіді:
0 для відповіді № 1Я вважаю, що вам потрібно factorize
разом зі всіма стовпцями:
df["new"] = pd.factorize(df["Level 1"] + df["Level 2"] + df["Level 3"])[0]