/ / LIBSVM Wie bereite ich einen Trainingsdatensatz mit Bildern für die Logoerkennung vor? - maschinelles Lernen, Klassifizierung, svm, libsvm

LIBSVM Wie bereite ich Trainingsdatensätze mit Bildern für die Logoerkennung vor? - maschinelles Lernen, Klassifikation, svm, libsvm

AUFGABE: Ich habe mehr als hunderttausend Bilder von Videos (Video-Frames) und ich muss klassifizieren, welche Bilder Logos von meiner Liste haben.

DAS PROBLEM: Ich habe eine Bibliothek mit Logo-Bildern erstellt. Für die Klassifizierungsaufgabe verwende ich LIBSVM. Ich muss Bilder in das Format eines SVM-Datensatzes umwandeln. Ich habe die Materialien auf der LIBSVM-Website, FAQ & "Ein praktisches Handbuch zur Unterstützung der Vektorklassifizierung" durchgelesen. Ich kann jedoch immer noch keine Antwort auf die Vorbereitung von Daten / Bildern für das LIBSVM-Training finden. Ich werde jede Hilfe schätzen.

Antworten:

1 für die Antwort № 1

Sie müssen Ihre Daten vektorisieren, indem Sie ein Feature-Set Ihrer Wahl verwenden, das anhand von Bildern berechnet werden kann. Ich werde hier nicht auf alle Details eingehen, da dies eine Rolle spielen würde Weg zu viel Platz und für SO kein Thema.

Kurz gesagt, der beste Weg zur Vektorisierung hängt davon abweitgehend auf den Formen, die Sie erkennen möchten (z. B. die Logos). Die Hough-Transformation wird unter anderem fast immer verwendet, daher sollten Sie sich das genauer ansehen.

Zweitens wird im Allgemeinen eine Objekterkennung durchgeführtDurch Ausführen eines Satzes von Klassifizierern auf vielen Schwenks / Zooms / Rotationen für jedes einzelne Bild. In diesem Zusammenhang möchten Sie Klassifikatoren mit sehr geringer Laufzeitkomplexität verwenden. Die linearen Kern- und Kreuzungskerne werden häufig verwendet. Schnittpunktkerne werden von LIBSVM nicht bereitgestellt, Sie können sie jedoch selbst berechnen. Aus Gründen der Komplexität ist es wahrscheinlich interessanter, LIBLINEAR zu verwenden, das explizit die trennende Hyperebene erstellt und somit an prognostiziert viel geringere Komplexität