/ / No Jython, como posso criar uma cadeia unicode a partir da seqüência de bytes utf-8? - python, unicode, utf-8, jython, decodificação

No Jython, como posso criar uma cadeia unicode a partir da sequência de bytes utf-8? - python, unicode, utf-8, jython, decodificação

Um caractere Unicode japonês "あ" s utf-8 é uma sequência de três bytes, E38182. E eu tenho isso em uma lista de Jython como essa;

>>> [0xE3, 0x81, 0x82]
[227, 129, 130]

Posso converter essa lista de seqüências de bytes de utf-8 em uma string unicode do Jython? Eu quero imprimir "あ" imprimindo a string unicode como a seguinte;

str = convert_utf8_list_to_unicode([0xE3, 0x81, 0x82])
print str # => あ
  • SO: Mac OS X 10.9.3 Mavericks
  • Jython: 2.5.3
  • Java: 1.6.0_65

Respostas:

1 para resposta № 1

Tente isto:

a = [0xE3, 0x81, 0x82]
print "".join([chr(c) for c in a]).decode("utf-8")

Isso funciona no Python normal para mim. Eu não sei se é diferente no Jython.