Robiłem grupowanie za pomocą sklearnkmeans i algorytm DBSCAN w zestawach danych z 2 funkcjami. Muszę grupować dane o bardzo wysokich wymiarach, powiedzieć 800-900 Chcę wiedzieć, jak można to osiągnąć możliwie dokładnie.
P.S: Po kilku poszukiwaniach zdałem sobie sprawę, że można zastosować PCA do redukcji wymiarów, ale chcę wiedzieć, czy jest jakikolwiek inny sposób w dowolnej innej bibliotece, jeśli nie nauczyłem się.
Odpowiedzi:
0 dla odpowiedzi № 1ty mogą uruchom KMeans i DBSCAN na danych wielowymiarowych.
Jest to również wewnętrzna wymiarowośćsprawy 900-wymiarowy zestaw danych, w którym 898 wymiarów jest stałych 0, zachowa się dokładnie tak, jak dwuwymiarowy zestaw danych (cóż, prawdopodobnie zajmuje to 450x dłużej, ale należy się tego spodziewać).