/ / LIBSVMロゴ検出用の画像を含むトレーニングデータセットの準備方法-機械学習、分類、svm、libsvm

LIBSVMロゴ検出のための画像付きトレーニングデータセットの作成方法 - 機械学習、分類、svm、libsvm

仕事: ビデオ(ビデオフレーム)から取得した10万枚の画像があり、リストからロゴのある画像を分類する必要があります。

問題: ロゴ画像のライブラリを作成しました。 分類タスクでは、LIBSVMを使用します。画像をSVMデータセットの形式に変換する必要があります。LIBSVMWebサイトの資料、FAQおよび「ベクタークラシエーションをサポートする実用ガイド」を読みました。 しかし、LIBSVMトレーニング用のデータ/イメージを準備する方法についての答えはまだ見つかりません。 私はどんな助けにも感謝します。

回答:

回答№1は1

画像に基づいて計算できる選択の機能セットを使用して、データをベクトル化する必要があります。ここですべての詳細については詳しく説明しません。 方法 スペースが多すぎて、SOのトピックから外れています。

要するに、ベクトル化する最良の方法は主に検出したい形状(ロゴなど)。ハフ変換は、ほとんどの場合、特に使用されているので、調べてみてください。

第二に、オブジェクト検出は一般的に実行されます各単一画像の多くのパン/ズーム/回転で一連の分類器を実行することにより。このコンテキストでは、実行時の複雑さが非常に低い分類子を使用する必要があります。線形カーネルと交差カーネルが一般的に使用されます。交差点カーネルはLIBSVMによって提供されませんが、自分で計算できます。複雑さの理由で、LIBLINEARを使用することはおそらく興味深いでしょう。LIBLINEARは明示的に分離超平面を構築し、したがって、 たくさん より低い複雑さ。