Estoy leyendo este libro "Procesamiento de texto Python con NLTK", y en el libro los resultados son:
>>> stopwords.fileids()
["danish", "dutch", "english", "finnish", "french", "german", "hungarian", "italian", "norwegian", "portuguese", "russian", "spanish", "swedish", "turkish"]
Pero a medida que corro los códigos en el terminal, los resultados son:
>>> stopwords.fileids()
[u"danish", u"dutch", u"english", u"finnish", u"french", u"german", u"hungarian", u"italian", u"norwegian", u"portuguese", u"russian", u"spanish", u"swedish", u"turkish"]
¿Qué es la "u" delante de cada cuerda?
Respuestas
4 para la respuesta № 1los u
significa una cadena que contiene Unicode
Lo que puede comprobar por usted mismo escribiendo esto en su intérprete de python:
s = unicode("abcdef")
type(s) # <type "unicode">
t = u"unicode"
type(t) #<type "unicode">
Más información sobre cadenas Unicode. python2 | python3