Pomoc w programowaniu, odpowiedzi na pytania / Nauczanie maszynowe / Jak klastrować wielowymiarowy zestaw danych w Pythonie? - uczenie maszynowe, analiza skupień, pca

Jak grupować wielowymiarowy zestaw danych w pythonie? - uczenie maszynowe, analiza skupień, pca

Robiłem grupowanie za pomocą sklearnkmeans i algorytm DBSCAN w zestawach danych z 2 funkcjami. Muszę grupować dane o bardzo wysokich wymiarach, powiedzieć 800-900 Chcę wiedzieć, jak można to osiągnąć możliwie dokładnie.

P.S: Po kilku poszukiwaniach zdałem sobie sprawę, że można zastosować PCA do redukcji wymiarów, ale chcę wiedzieć, czy jest jakikolwiek inny sposób w dowolnej innej bibliotece, jeśli nie nauczyłem się.

Odpowiedzi:

0 dla odpowiedzi № 1

ty mogą uruchom KMeans i DBSCAN na danych wielowymiarowych.

Jest to również wewnętrzna wymiarowośćsprawy 900-wymiarowy zestaw danych, w którym 898 wymiarów jest stałych 0, zachowa się dokładnie tak, jak dwuwymiarowy zestaw danych (cóż, prawdopodobnie zajmuje to 450x dłużej, ale należy się tego spodziewać).

Powiązane pytania

Różne wyjścia na liczbę partycji w iskrze - scala, apache-iskrze, apache-iskrze-standalone

Klaster Akka nie uruchamia się podczas ręcznego łączenia - scala, cluster computing, akka, akka-cluster

R: Przeprowadziłem analizę skupień - w jaki sposób mogę dołączyć klasyfikację grupową do moich oryginalnych danych? - r, analiza skupień

Określanie wielkości klastra po Kmeans w Pythonie - python, uczenie maszynowe, klastry komputerowe, analiza danych

Jak wygenerować tokeny dla mojego dwuprocesorowego klastra Cassandra? - python, kassandra, datastax-enterprise, opscenter

Jak wprowadzić dane do twittera (csv / txt) do pythona DBSCAN? - python, numpy, dbscan

Cluster two features in Python - python, machine-learning, scikit-learn, cluster-analysis

Matlab wyprowadza każdy klaster z klastera rozmytego - matlab, analizę skupień, rozmyte

Jak określić klaster nie ma znaczenia w klastrze internetowym? - uczenie maszynowe, eksploracja danych, analiza skupień

analiza skupień? oznaczenie klastra - uczenie maszynowe, klasyfikacja, analiza skupień, eksploracja danych

Logikelihood podobieństwo do klastra dokumentów - uczenie maszynowe, analiza skupień, podobieństwo, eksploracja tekstów

Eksploracja tekstów i uczenie maszynowe [zamknięte] - uczenie maszynowe, nlp, analiza klastrów, eksploracja tekstów, rozpoznawanie nazwanych jednostek

Jak podłączyć mac do klastra hadoop / hdfs - hadoop, hdfs, cloudera

Bezpiecznik Hadoop na multinode - hadoop

Multi GPU a klastra GPU - cuda, klastry, gpu, multi-gpu

Wysoko-wymiarowe klastrowanie danych - c #, algorytm, analiza klastrowa, eksploracja danych

Analizowanie jednorodności klastra i korzystanie z Operatora Cluster Distance Performance w RapidMiner - analiza skupień, k-średnich, rapidminer

Odległości między klastrami i wewnątrz klastra - analiza skupień

Ile minimalnego komputera wymaga konfiguracja klastra CEPH? lub Czy mogę skonfigurować klaster CEPH na jednym komputerze? - ceph

spark-submit Transfer plików z lokalnego do klastra - apache-spark-1.3