/ / Як класифікувати безперервні дані? - машинознавство, класифікація

Як класифікувати безперервні дані? - машинознавство, класифікація

У мене є два залежних постійних змінних і яхочете використовувати їх комбіновані значення, щоб передбачити значення третьої бінарної змінної. Як мені розпочати дискретизацію / класифікацію цінностей? Я не шукаю алгоритмів кластеризації, я спеціально зацікавлений в отриманні "значущих" дискретних категорій, які я згодом зможу використовувати в байєському класифікаторі. Вказівники на папери, книги, онлайн-курси все дуже цінувалися!

Відповіді:

0 для відповіді № 1

Саме суть машинного навчання і проблема однієї з найбільш вивчених проблем.

Найменш квадратна регресія, логістична регресія, SVM, випадкові ліси широко використовуються для цього типу проблеми, яка називається бінарною класифікацією.

Якщо ваша мета - класифікувати ваші дані прагматично, доступні декілька бібліотек, таких як Scikits-learn в python і weka в java. Вони мають чудову документацію.

Але якщо ви хочете зрозуміти, що є внутрішньою ознакою машинного навчання, просто виконайте пошук (тут чи на google) для ресурсів машинного навчання.


0 для відповіді № 2

Якщо ти хочеш бути справжнім курортом, створіть купурізних можливих дискретизацій, а потім навчати класифікатору на ньому, а потім охарактеризувати дискректизацію за допомогою функцій, а потім запустити класифікатор на це і побачити, які саме дискретизації найкращі !?

Взагалі, дискретизуючі матеріали - це більше мистецтва та добре розуміння того, що означає значення вхідної змінної.