/ / Apprendimento non supervisionato in R? Classificare le matrici: qual è il pacchetto giusto? [chiuso] - r, machine-learning, cluster-analysis, apprendimento non supervisionato

Apprendimento senza supervisione in R? Classificare le matrici: qual è il pacchetto giusto? [chiuso] - r, machine-learning, cluster-analysis, apprendimento non supervisionato

Recentemente ho guardato un sacco di Stanford "esilarante Apri Classroom "s lezioni video In particolare, la parte sull'apprendimento automatico senza supervisione ha attirato la mia attenzione. Sfortunatamente si ferma, potrebbe essere ancora più interessante.

Fondamentalmente sto cercando di classificare discretomatrici mediante un algoritmo non supervisionato. Queste matrici contengono solo valori discreti dello stesso intervallo. Diciamo che ho migliaia di matrici 20x15 con valori compresi tra 1 e 3. Ho appena iniziato a leggere la letteratura e sento che la classificazione delle immagini è molto più complessa (istogrammi dei colori) e che il mio caso è piuttosto una semplificazione di cosa viene fatto lì

Ho anche guardato il Machine Learning e Grappolo Cran Task Views ma non so da dove iniziare con un esempio pratico.

Quindi la mia domanda è: quale pacchetto / algoritmo sarebbe una buona scelta per iniziare a giocare e lavorare sul problema in R?

MODIFICARE: Mi sono reso conto che avrei potuto essere impreciso: la mia matrice contiene dati di scelta discreti, quindi il clustering medio (!) Potrebbe non essere l'idea giusta. Capisco ciò che hai detto sui vettori e sull'osservazione, ma spero in qualche funzione che accetti matrici o data.frames, perché ho diverse osservazioni nel tempo.

EDIT2: Mi rendo conto che un pacchetto / funzione, introduzione che si concentra sulla classificazione senza supervisione dei dati categoriali è ciò che mi aiuterebbe di più al momento.

risposte:

0 per risposta № 1

... classifica le matrici discrete con un algoritmo non supervisionato

Devi significare raggrupparli. La classificazione viene comunemente eseguita da algoritmi supervisionati.

Sento che la classificazione delle immagini è molto più complessa (istogrammi dei colori) e che il mio caso è piuttosto una semplificazione di ciò che viene fatto lì

Senza sapere cosa rappresentano le tue matrici,è difficile dire quale tipo di algoritmo ti serva, ma un punto di partenza potrebbe essere quello di appiattire le tue matrici 20 * 15 per produrre vettori di lunghezza 300: ogni elemento di tale vettore sarebbe quindi un caratteristica (o variabile) per basare un clustering. Questo è il modo in cui i pacchetti ML devono essere inclusi Cluster pacchetto a cui ti colleghi, lavoro: "Nel caso di una matrice o di un frame di dati, ogni riga corrisponde a un'osservazione, e ogni colonna corrisponde a una variabile. "


0 per risposta № 2

Finora ho trovato daisy dal cluster pacchetto rispettivamente l'argomento "gower" che si riferisce a Gower"s similarity coefficient per gestire più modalità di dati. Gower sembra essere una metrica a distanza abbastanza unica, tuttavia è ciò che ho trovato utile per i dati categoriali.


-1 per risposta № 3

Potresti voler iniziare da qui: http://cran.r-project.org/web/views/MachineLearning.html