Pomoc w programowaniu, odpowiedzi na pytania / Nauczanie maszynowe / Jak kategoryzować dane ciągłe? - uczenie maszynowe, klasyfikacja

Jak kategoryzować dane ciągłe? - uczenie maszynowe, klasyfikacja

Mam dwie zależne zmienne ciągłe i ichcą użyć połączonych wartości do przewidywania wartości trzeciej zmiennej binarnej. Jak mogę dyskretyzować / kategoryzować wartości? Nie szukam algorytmów grupowania, jestem szczególnie zainteresowany uzyskaniem "znaczących" dyskretnych kategorii, które mogę później wykorzystać w klasyfikatorze Bayesian. Wskaźniki do dokumentów, książek, kursów online, wszystkie bardzo doceniane!

Odpowiedzi:

0 dla odpowiedzi № 1

To jest esencja uczenie maszynowego i problem jeden z najlepiej zbadanych problemów.

Regresja najmniejszych kwadratów, regresja logistyczna, SVM, losowy las są szeroko stosowane w tego typu problemach, co nazywa się klasyfikacją binarną.

Jeśli Twoim celem jest pragmatyczna klasyfikacja danych, dostępnych jest kilka bibliotek, takich jak Scikit - ucz się w Pythonie i Weka w Javie. Mają świetną dokumentację.

Ale jeśli chcesz zrozumieć, co jest nieodłączną częścią uczenia maszynowego, po prostu wyszukaj (tutaj lub w google) zasoby do uczenia maszynowego.

0 dla odpowiedzi nr 2

Jeśli chcesz być prawdziwym kujonem, wygeneruj kilkaróżnych możliwych dyskretyzacji, a następnie wyszkolić na nim klasyfikator, a następnie scharakteryzować dyskretyzacje według cech, a następnie uruchomić na nim klasyfikator i zobaczyć, jakie rodzaje dyskretyzacji są najlepsze !?

Ogólnie rzecz biorąc dyskretyzacja jest bardziej sztuką i dobrze rozumie, co oznaczają zmienne zakresy wejściowe.

Powiązane pytania

Drzewa decyzyjne do klasyfikacji dokumentów - r, nlp, klasyfikacja, eksploracja tekstów, klasyfikacja dokumentów

jak dokonać klasyfikacji w stosunku do danych prognozy - r, klasyfikacja

Metody uczenia wzmocnień, które mapują ciągłe na ciągłe - python, uczenie maszynowe, uczenie wzmacniania, ekonomia

Identyfikacja cech sygnału - python, audio, uczenie maszynowe, przetwarzanie sygnałów

Czy muszę dokonać wyboru cech przed zastosowaniem algorytmu uczenia maszynowego? - python, algorytm, klasyfikacja, knn, nadzorowane uczenie się

Przykładowa kolejność w algorytmach uczenia maszynowego (Scikit Learn) - python, numpy, machine-learning, scipy, scikit-learn

Czy istnieje algorytm uczenia maszynowego, który łączy klasyfikację i regresję w jedno - python, uczenie maszynowe, klasyfikacja, głębokie uczenie się, regresja

Klasyfikacja Tensorflow Multi-feature [closed] - python, uczenie maszynowe, tensorflow

ciągła integracja do uczenia maszynowego [zamknięta] - python, uczenie maszynowe

Uczenie maszynowe z pakietem python chatterbot - python, machine-learning, chatterbot

Uczenie maszynowe: jak radzić sobie z dyskretnymi i ciągłymi danymi - matlab, uczenie maszynowe, klasyfikacja

Co jest lepsze w rozwiązywaniu problemów ze wzorcem? Uczenie maszynowe lub sieci neuronowe? - uczenie maszynowe, sieć neuronowa, rozpoznawanie wzorców

W jaki sposób obliczane jest AUC drzewa decyzyjnego? - uczenie maszynowe, drzewo decyzyjne

jak wyprowadzić algorytmy klasyfikacji uczącej się maszyny wektorowej - uczenie maszynowe, klasyfikacja

Dlaczego nie należy podchodzić do klasyfikacji poprzez regresję? - nauczanie maszynowe

Głęboka nauka przewidywania temperatury - uczenie maszynowe, głębokie uczenie się, przewidywanie, temperatura

python jednoznacznie lub etykietowanie etykiet dla zmiennej kategorii z 2 poziomami? - uczenie maszynowe, dane kategoryczne

Różne wykorzystanie klasyfikatorów uczenia maszynowego [zamknięte] - uczenie maszynowe, klasyfikacja

Różnica między klasyfikacją a prognozowaniem? - uczenie maszynowe, klasyfikacja, przewidywanie

Klasyfikuj dane za pomocą Apache Mahout - apache, machine-learning, hadoop, mahout