Pomoc w programowaniu, odpowiedzi na pytania / Klasyfikacja / Sugerowana nienadzorowana metoda selekcji / ekstrakcji dla klasyfikacji 2 klas? - klasyfikacja, ekstrakcja cech, wybór cech

Sugerowana nienadzorowana metoda selekcji / ekstrakcji dla klasyfikacji 2 klas? - klasyfikacja, ekstrakcja cech, wybór cech

Mam zestaw funkcji F, np. Przestrzeń barw Lab, entropię, łącząc wszystkie funkcje razem, otrzymuję wektor cech wymiarowania d (od 12 do 50, w zależności od wybranych funkcji).

Zwykle otrzymuję od 1000 do 5000 nowych próbek,oznaczono x. Model Gaussian Model jest następnie ćwiczony z wektorami, ale nie wiem, z której klasy pochodzą, ale wiem tylko, że są tylko dwie klasy. Na podstawie prognozy GMM otrzymuję prawdopodobieństwo tego wektora cech należące do klasy 1 lub 2.

Moje pytanie brzmi teraz: Jak uzyskać najlepszy podzbiór funkcji, na przykład tylko entropię i znormalizowany rgb, które dadzą mi najlepszą dokładność klasyfikacji? Sądzę, że osiąga się to, jeśli rozdzielność klas zostanie zwiększona ze względu na wybór podzbioru funkcji.

Być może wykorzystam liniowy dyskryminator Fisheraanaliza? Ponieważ mam już macierze średnie i kowariancje uzyskane z GMM. Ale czy nie musiałbym obliczać wyniku dla każdej kombinacji funkcji?

Byłoby miło uzyskać pomoc, jeśli jest to niewdzięczne podejście i jestem na niewłaściwym torze i / lub jakichkolwiek innych sugestiach?

Odpowiedzi:

0 dla odpowiedzi № 1

Jednym ze sposobów na znalezienie "informacyjnych" funkcji jest wykorzystanie funkcji, które maksymalizują prawdopodobieństwo logowania. Możesz to zrobić, używając sprawdzania poprawności krzyżowej.

https://www.cs.cmu.edu/~kdeng/thesis/feature.pdf

Innym pomysłem może być użycie innego nienadzorowanego algorytmu, który automatycznie wybiera funkcje, takie jak las klastrowy

http://research.microsoft.com/pubs/155552/decisionForests_MSR_TR_2011_114.pdf

W takim przypadku algorytm grupowania automatycznie podzieli dane na podstawie wzmocnienia informacji.

Fisher LDA nie wybierze funkcji, ale projekttwoje oryginalne dane w podprzestrzennej przestrzeni wymiarowej. Jeśli szukasz metody podprzestrzennej Innym interesującym podejściem może być spektroskopia klastrowa, która również ma miejsce w podprzestrzeni lub nienadzorowanych sieciach neuronowych, takich jak automatyczny koder.

Nadzieja, która pomaga