/ / Как да внедрим алгоритъм за клъстериране на DBSCAN? - алгоритъм, клъстер-анализ, dbscan

Как да внедрим алгоритъм за клъстериране на DBSCAN? - алгоритъм, клъстер-анализ, dbscan

Опитвам се да внедря DBSCAN но не мога да разбера идеята зад него. Ако минава през цялата информация 1 към 1 и създава нов клъстер за близки съседи, тогава винаги ще получавам много клъстери. Казвам, че проверява близките съседи на 1 точка, намира достатъчно съседи (>MinPts), създава клъстер за тях, преминава към следващияточка, проверка за съседи (може да намерите съседи, които вече са в клъстер) и да създадете нов клъстер за тях. и така нататък. Така че някои точки ще бъдат добавени към повече от един клъстер ... По този начин ще бъдат създадени много клъстери.

Може ли някой да обясни как работи този алгоритъм? Не намерих много информация за това онлайн.

Отговори:

0 за отговор № 1

Не, след като сте създали клъстер, тогава ще погледнететочките в клъстера и ако някой от тях има достатъчно плътност, за да има свой собствен клъстер, тогава всички точки в този "протокруп" се добавят към първоначалния клъстер. По този начин тя продължава да се агломерира, докато няма намаляване на плътността, така че да се добавят точки, които нямат достатъчно съседни точки, за да продължат процеса. Когато това стане, всички точки в този клъстер са пазарни "затворени" и процесът отново започва да търси нов клъстер в останалите "отворени" възли.


0 за отговор № 2

Има много материали за DBSCAN в мрежата ... Дори ако проверите Уикипедия, можете да намерите подробен алгоритъм за него:

http://en.wikipedia.org/wiki/DBSCAN#Algorithm

Кой език използвате, за да го кодирате? Ако сте запознати с MATLAB, Java или r, има много онлайн реализации, които може би ще ви помогнат ...

Един добър източник за начало ще бъде оригиналната книга ...