/ /データマイニングにおけるクラスタ数の決定 - クラスタ分析、データマイニング

データマイニングにおけるクラスタ数の決定 - クラスタ分析、データマイニング

これまでにいくつかのデータをクラスタリングしたいときは、ユーザーごとにクラスタ数を指定する必要があります。 K-Meansアルゴリズムと同様に、クラスタの必要性を指定する必要があります。

私の質問は、特定のデータセットに対してどのようにクラスタが実行可能であるかをアルゴリズムが決定する可能性があります。

回答:

回答№1は0

いくつかのクラスタリングアルゴリズムがありますアルゴリズムへの入力として所望の数のクラスタを必要としない。そのようなアルゴリズムの一例は平均シフトクラスタリングアルゴリズムである。ただし、アルゴリズムの入力としてカーネルを指定する必要があります。このカーネル選択(例えば、カーネルのサイズと形状)は、出力として得られるクラスタの数に影響します。

さらに詳しい情報:
http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/TUZEL1/MeanShift.pdf
http://scikit-learn.org/stable/auto_examples/cluster/plot_mean_shift.html


回答№2の場合は0

私はそれに精通していませんが、例えば、kmeansのクラスタ数を自動的に決定する方法があります。 非常に複雑ですが、データセットとクラスターメソッドを使用すると、クラスターの数を推定するためにギャップ統計値を計算できます。 Rユーザーの場合は、clusGapとmaxSE関数を調べてみてください。