Можливі дублікати:
Розбір HTML в Python
Я новачок у python, я використовую python.Я завантажив HTML-файл з мого сайту.і цей завантажений HTML-файл має деякі URL-адреси. Я хочу, щоб лише деякі URL-адреси цього HTML-файла були записані в окремий текстовий файл за допомогою python.how, що я можу зробити це? хтось може мені допомогти?
Відповіді:
3 для відповіді № 1Використовуйте Красивий суп.
Beautiful Soup - бібліотека Python для витягуваннядані з HTML та XML-файлів. Він працює з вашим улюбленим аналізатором, щоб забезпечити ідіоматичні способи навігації, пошуку та зміни дерева аналізу. Зазвичай це економить програмістам години або дні роботи.