/ / python onehotencoding или labelencoding за променлива с 2 нива? - машинно обучение, категорични данни

python onehotencoding или labelencoding за категория променлива с 2 нива? - машинно обучение, категорични данни

Работя върху проблема с бинарната класификацияизползване на ML, където моите данни имат функция само с 2 нива, където едно ниво има по-голямо значение от друго. Тя не е чисто категорична (това не е точно като пол). Onehotencoder за само 2 нива ще направи толкова голяма разлика в сравнение с обикновения LabelEncoder в този случай? В какви сценарии използваме onehotencoding / labelencoding?

Отговори:

0 за отговор № 1

Това зависи от това какъв алгоритъм за машинно обучение ще използвате за вашите данни.

Каква е крайната ви цел? Класификация ли е? Групира ли се?

Ако е класификация, тогава използването на определени видове класификатори ще има смисъл само ако имате една горещо кодирана етикета.

По принцип е по-добре да се класифицирате, ако едно-горе-кодирате вашите категорични характеристики.