Estoy tratando de dividir un archivo de texto en un conjunto de palabras usando expresiones regulares de python. Para lograr esto he intentado usar re.findall()
con el w+
bandera.
El problema en mi caso es que la expresión regular está dividiendo palabras que contienen una sola cita. Tomemos por ejemplo la palabra "he" s
Mi función es dividir esto en dos palabras separadas; he
y s
¿Cómo reescribo esta expresión regular de python para que las palabras que contienen una sola cita no se dividan en dos?
Respuestas
1 para la respuesta № 1test = "this is it"s"
regex = re.compile("w+"?w+?")
regex.findall(test)
me da => ["este", "es", "es" s "]