Я шукаю чисті рішення Ruby (або Java) для прикраси HTML-коду.
Я використовую Hpricot для аналізу HTML, оскількиNokogiri та інші HTML-парсери вимагають зовнішніх C-програм. Я вважаю, що я можу використовувати Hpricot для очищення HTML, якщо я можу придумати хороший алгоритм. Я б не хотів повторювати, якщо це вже зроблено.
Відповіді:
1 для відповіді № 1Можливо, ви можете спробувати jtidy?
"JTidy - це порт Java Tidy, a Синтаксис HTMLперевірка і досить принтера. Як і його двоюрідний брат, що не є Java JTidy можна використовувати як інструмент для очищення неправильного і несправного HTML. Крім того, JTidy надає DOM інтерфейс до документа, який є обробляється, що ефективно дозволяє використовувати JTidy як DOM синтаксичний аналізатор для реального HTML.
JTidy був написаний Енді Швидко, який пізніше пішов у відставку позиції. Тепер JTidy підтримується a добровольців.
Більш детальну інформацію про JTidy можна знайти на сторінці проекту JTidy SourceForge .