/ / Edukacja bez nadzoru w R? Klasyfikuj Matryce - jaki jest właściwy pakiet? [zamknięty] - r, uczenie maszynowe, analiza skupień, uczenie bez nadzoru

Uczenie bez nadzoru w R? Klasyfikuj Matryce - jaki jest właściwy pakiet? [zamknięty] - r, uczenie maszynowe, analiza skupień, uczenie bez nadzoru

Ostatnio oglądałem wiele zabawnych rzeczy Stanforda Open Classroom "s wykłady wideo. Szczególnie moją uwagę zwróciła część o bezobsługowym uczeniu maszynowym. Niestety przestaje, bo może się jeszcze bardziej interesować.

Zasadniczo szukam klasyfikacji dyskretnejmacierze za pomocą nienadzorowanego algorytmu. Te macierze zawierają tylko dyskretne wartości tego samego zakresu. Powiedzmy, że mam 1000 matryc 20x15, które mają wartości od 1 do 3. Właśnie zacząłem czytać literaturę i uważam, że klasyfikacja zdjęć jest o wiele bardziej złożona (histogramy kolorów) i że mój przypadek jest raczej uproszczeniem co się tam dzieje.

Spojrzałem również na Nauczanie maszynowe i Grupa Cran Task Views, ale nie wiadomo, od czego zacząć od praktycznego przykładu.

Moje pytanie brzmi: który pakiet / algorytm będzie dobrym wyborem do rozpoczęcia zabawy i pracy nad problemem w R?

EDYTOWAĆ: Zdałem sobie sprawę, że mogłem być nieprecyzyjny: Moja matryca zawiera dyskretne dane dotyczące wyboru - więc średnie skupienie może (!) Nie być właściwym pomysłem. Rozumiem, co powiedziałeś na temat wektorów i obserwacji, ale mam nadzieję na jakąś funkcję, która akceptuje matryce lub dane.frames, ponieważ mam kilka obserwacji w czasie.

EDIT2: Zdaję sobie sprawę, że pakiet / funkcja, wprowadzenie, które koncentruje się na nienadzorowanej klasyfikacji kategorii danych, jest tym, co pomogłoby mi teraz najlepiej.

Odpowiedzi:

0 dla odpowiedzi № 1

... klasyfikuj dyskretne macierze za pomocą nienadzorowanego algorytmu

Musisz ich oznaczać jako klaster. Klasyfikacja jest zwykle wykonywana przez nadzorowane algorytmy.

Uważam, że klasyfikacja obrazów jest o wiele bardziej złożona (histogramy kolorów), a moja sprawa jest raczej uproszczeniem tego, co się tam dzieje

Nie wiedząc, co reprezentują twoje matryce,Trudno powiedzieć, jakiego rodzaju algorytmu potrzebujesz, ale punktem wyjścia może być spłaszczenie macierzy 20 * 15 w celu wygenerowania wektorów długości 300, każdy element takiego wektora byłby wtedy cecha (lub zmienna), aby oprzeć klastrowanie. W ten sposób muszą pakiety ML, w tym Cluster pakiet, do którego linkujesz, praca: "W przypadku macierzy lub ramki danych, każdy wiersz odpowiada obserwacji i każda kolumna odpowiada zmiennej. "


0 dla odpowiedzi nr 2

Jak dotąd znalazłem daisy z cluster pakuje odpowiednio argument "gower", który odnosi się do Gower"s similarity coefficient do obsługi wielu trybów danych. Gower wydaje się być metryką o dość dużej odległości, ale to jest to, co znalazłem do użytku z kategorycznymi danymi.


-1 dla odpowiedzi nr 3

Możesz zacząć od tego miejsca: http://cran.r-project.org/web/views/MachineLearning.html