Ayuda en la programación, respuestas a preguntas / Pitón / ¿Cuál sería la expresión de expresiones regulares si quisiera tokenizar una cadena por espacios, -, 'y "en Python? [Cerrado] - python, regex, python-2.7

¿Cuál sería la expresión de expresiones regulares si quisiera poner tokenizar una cadena por espacios, -, ', y "en Python? [Cerrado] - python, regex, python-2.7

El siguiente código:

string = "Hello, I am 5"8" tall - wow"
regex = re.compile(r"<<regex expression goes here>>")
tokenized_string = regex.split(string)
print tokenized_string

Debería imprimir:

["Hello", "I", "am", "5", """, "8", """, "tall", "-", "wow"]

Así que debe ignorar espacios, comas, etc., pero tokenize "-", """y """.

¿Cuál sería la expresión regular correcta para hacer esto?

Respuestas

2 para la respuesta № 1

¿Qué hay de usar re.findall en lugar de re.split?

>>> import re
>>> s = "Hello, I am 5"8" tall - wow"
>>> re.findall(r"""w+|[-""]""", s)
["Hello", "I", "am", "5", """, "8", """, "tall", "-", "wow"]

El patrón anterior coincide con los caracteres de las palabras (w+) o -, ", ".

NOTA: carácter de la palabra (w) coincide con alfabetos, dígitos, y _. Si quieres excluir _, utilizar [A-Za-z0-9] en lugar de w.

preguntas relacionadas

Python: elimina todo, excepto las letras y los espacios en blanco de la cadena - python, regex

Regex w + divide palabras con una sola cita [cerrada] - python, regex

regex - cómo hacer coincidir un grupo de caracteres únicos de cierta longitud - python, regex, grupo de captura

Conversión de una expresión Perl Regex en Python: python, regex, perl

Python: RegEx, toda aparición de texto "NN.N por ciento" a "NN.N%" - python, regex, python-3.x

encuentre todas las coincidencias para unicodes en una cadena en python - python, regex, python-2.7, unicode, python-unicode

En Python, ¿cómo verificar si una cadena concuerda con una de las expresiones regulares en la matriz 'eficientemente'? - python, regex, python-3.x

Uso de expresiones regulares en mi Raspberry Pi - python, regex, raspberry-pi, raspbian

¿Cómo buscar y reemplazar cadenas usando reg ex en python en las siguientes condiciones? [cerrado] - python, expresiones regulares, cadena, reemplazar

Indicador de Python Regex DUPLICATE_NAMES - python, regex, python-2.7

La expresión regular de correo electrónico de Python no funciona: python, regex, python-3.x

expresión regular de python: cómo dividir la cadena en distintos grupos según alfabetos, dígitos y puntuación - python, regex

Reemplazo de etiquetas HTML usando regex y python - python, html, regex, tags

Regex para mayúsculas y guiones bajos entre signos de porcentaje: python, regex

Coincidencia de entradas con una expresión regular en Python [duplicado] - python, regex, input, match

Problema con la retroreferencia de expresiones regulares en Python: python, regex, python-3.x

Versión de expresión regular de la cadena python [duplicado] - python, regex, cadena

Regex de Python para hacer coincidir dos o tres espacios en blanco: python, regex, string

Negativo Regex Python - python, regex

Diferencias en la sintaxis de expresiones regulares en Python y Java - java, python, regex