/ / Кластерна оцінка - матлаб, кластерний аналіз

Кластеризація - MATLAB, кластер-аналіз

Скажімо, у мене є мітка набору данихкластеризовано (мітка - це ідентифікація всіх даних, до якого кластера він також належить). Тепер, якщо я використовував будь-який алгоритм кластеризації в Matlab (kmeans, ...), як я міг дізнатися, чи примірник кластеризований правильно чи ні. Знаючи, що скажімо, kmeans кластеризований екземпляр одного набору даних, який знаходиться в кластерах 2, але мічені дані говорять про те, що він належить до кластера 1. Однак кластер 2 в наборі даних, що позначений міткою, може бути таким же, як кластер один у передбачених мітках (але мають інший зворотний імена як передбачуваного, так і міченого). Що ти пропонуєш?

Спасибі заздалегідь.

Відповіді:

0 для відповіді № 1

Якщо я зрозумів це правильно, ви намагаєтесь порівнятиМітки "основної істини", знайдені вашим алгоритмом, і мають проблему, що вони можуть бути згруповані правильно, але з різними мітками. Якщо це правильно, ви можете спробувати grp2idx на обох векторах міток, оскільки це, схоже, присвоює першому кластеру, він знаходить мітку "1" та наступну "2" тощо.

Редагувати: grp2idx цього не робить, він просто змінює мітки на найменші можливі, але grp2idx ([2 1 2 2 3]) стає [2 1 2 2 3], тому він не впорядковує їх по-іншому. Ви можете, наприклад, взяти вихід grp2idx на обох векторах міток, субстрагувати їх, і для кожного унікального значення вектора мітки різниця повинна бути однаковою.


0 для відповіді № 2

У Вікіпедії обговорюється кілька підходів.

Ряд заходів адаптований з різних варіантіввикористовується для оцінки завдань класифікації. Замість підрахунку кількості разів, коли клас було правильно присвоєно одній точці даних (відомий як справжній позитивний), такі метричні показники підрахунку пари оцінюють, чи передбачається, що кожна пара точок даних, яка справді знаходиться в одному кластері, буде однаковою кластер.

Показники підрахунку пар вирішують проблему необхідності зіставлення кластерів до класів, дивлячись на угоду, що таке "те саме", а що "інше".