/ / Skrobanie sieci: Wyodrębnianie tekstu w R za pomocą RVEST - r, skrobanie sieci, rvest

Web scraping: Wyodrębnij tekst w R używając RVEST - r, web scraping, rvest

„Pracuję na studiach, używając R, jak mogę wydobywać informacje”| 20 listopada 2015 r„używając pakietu RVEST? Próbowałem uzyskać klasę„ widget-info ”, ale przyniosłem również klasę„ widget-author ”

<div class="home-list-content">
<span class="widget-info">
<span class="widget-author">
Rúben Campanacho
</span>
| 20 de Novembro de 2015
</span>
<h2>
LG Pay é o sistema de pagamentos móveis da LG
</h2>
</div>

Mój kod:

pagina <- read_html("http://www.tecnologia.com.pt")
data <- pagina %>%
html_nodes(".widget-info") %>%
html_text() %>%
as.data.frame()

Wynik:

Rúben Campanacho | 20 de Novembro de 2015

Chcę tylko | 20 listopada 2015 r

Odpowiedzi:

1 dla odpowiedzi № 1
txt <- "Rúben Campanacho | 20 de Novembro de 2015"

gsub("^((\w+)[[:space:]]){2}", "", txt)

Zwroty:

"| 20 de Novembro de 2015"