/ / Чому витягувати функції SIFT на латках замість всього зображення? - обробка зображень, просіювання

Чому вилучити функції SIFT на патчі, а не на весь образ? - обробка зображень, просіяти

Деякі люди витягують функції SIFT з виправленьзображення, таке як "128-мірні SIFT-дескриптори, обчислювалися над 16 × 16 піксельними патчами, відібраними щільно по сітці з регулярним інтервалом 8 пікселів в горизонтальному і вертикальному напрямках".

Чому не витягають SIFT з оригінальних зображень безпосередньо?

Дякую!

Відповіді:

0 для відповіді № 1

Спочатку я хочу сказати, що функція SIFT IS a128-мірний дескриптор. 128 розмірів обчислюються з використанням сусідства 16x16, що містить фактично точку інтересу (екстремуми, отримані від DoG). Це досить конкретно (більше інформації та посилання на документи Lowes)

Об'єктивна частина полягає в тому, чому вони пробують над сіткою з регулярним інтервалом 8х8? Єдині причини, про які я можу подумати, це дійсно скорочення часу обчислення

  1. Створіть відоме число дескрипторів. Якщо зображення є MxN, то Кількість дескрипторів = (M / 8) x (N / 8) Запуск SIFT на цілому зображенні може призвести до багатьох дескрипторів, згрупованих разом. І потенційно може бути необмеженим. Оскільки кожен дескриптор є дорогим для обчислення, зменшення кількості зменшить час обчислення. Навіть невелике зображення 100x100 може мати сотні дескрипторів. Цей метод зменшить це до ~ 144

  2. Пошук ключових точок насправді є інтенсивним завданнямвласний. Вона включає в себе перевірку кожного окремого вокселя піраміди DoG і перевірку екстремумів (макс. Або хв.) З центром у вокселі (для кожної октави і кожних 3 шкал DoG). Якщо ви можете пропустити цей крок і просто припустити, що кожен сітчастий інтервал 8x8, ви усунете дорогу операцію проходження всього DoG і всіх октав і масштабів.

знову ж таки, це лише мої думки, але я сподіваюся, що це допоможе вам