Я працюю над проблемою двозначної класифікаціївикористовуючи ML, де мої дані мають функцію з лише двома рівнями, де один рівень має більше значення, ніж інший. Це не є чистим категоричним (це не точно як стать). Чи зможе один-єдиний кодувальник лише 2 рівня зробити таку різницю в порівнянні з простою LabelEncoder у цьому випадку? У яких сценаріях ми використовуємо однесистему / labelencoding?
Відповіді:
0 для відповіді № 1Це залежить від того, який алгоритм навчання комп'ютера використовуватиметься у ваших даних.
Яка ваша остаточна мета? Це класифікація? Це кластеризації?
Якщо це класифікація, то використання деяких видів класифікаторів буде мати сенс тільки в тому випадку, якщо у вас є одне гаряче закодоване мітки.
Загалом, класифікація краще, якщо ви одночасно кодуєте свої категоріальні функції.