Я хочу, щоб ми могли розпізнати, яку сторінку лише з тексту (без зображень) книгу, яку я читаю ... який найкращий підхід:
Я спочатку думав, що якісь зображення співпадають, але сторінки всієї книжки виглядають настільки схожими, не впевнені, наскільки добре це буде працювати?
Другою думкою було використання OCR ??
Будь-які ідеї чи пропозиції ... спасибі!
Відповіді:
2 для відповіді № 1Я думаю, що відповідність зображень дійсно марна у вашому випадку ... Якщо ви хочете виявити, на якій сторінці ви знаходитесь і що книга має пронумеровані сторінки, ви можете використовувати OCR, як Tesseract.
- 1) Знайдіть номер сторінки (верхній лівий кут, правий, нижній ..)
- 2) Витягніть його (витягніть зображення, щоб перейти до його декодування)
- (2bis) Попередня обробка зображення ...)
- 3) Розшифруйте його (використовуйте Tesseract або інший OCR)
Якщо ви не хочете використовувати OCR, ви можете подивитися на Ху моменти, якщо цифри є стандартними друкованими номерами, це може бути дуже добре в їх розпізнаванні.