Um caractere Unicode japonês "あ" s utf-8 é uma sequência de três bytes, E38182. E eu tenho isso em uma lista de Jython como essa;
>>> [0xE3, 0x81, 0x82]
[227, 129, 130]
Posso converter essa lista de seqüências de bytes de utf-8 em uma string unicode do Jython? Eu quero imprimir "あ" imprimindo a string unicode como a seguinte;
str = convert_utf8_list_to_unicode([0xE3, 0x81, 0x82])
print str # => あ
- SO: Mac OS X 10.9.3 Mavericks
- Jython: 2.5.3
- Java: 1.6.0_65
Respostas:
1 para resposta № 1Tente isto:
a = [0xE3, 0x81, 0x82]
print "".join([chr(c) for c in a]).decode("utf-8")
Isso funciona no Python normal para mim. Eu não sei se é diferente no Jython.