Ajuda na programação, respostas a perguntas / Python / Como converter uma string contendo unicode escape u #### para utf-8 string - python, python-3.x, unicode, python-unicode

Como converter uma string contendo unicode escape u #### para utf-8 string - python, python-3.x, unicode, python-unicode

Estou tentando isso desde a manhã.

Minhas sample.txt

choice = u9078u629e

Código:

with open("sample.txt", encoding="utf-8") as f:
for line in f:
print(line)
print("選択" in line)
print(line.encode("utf-8").decode("utf-8"))
print(line.encode().decode("utf-8"))
print(line.encode("utf-8").decode())
print(line.encode().decode("unicode-escape").encode("latin-1").decode("utf-8")) # as suggested.

out:
choice = u9078u629e
False
choice = u9078u629e
choice = u9078u629e
choice = u9078u629e
UnicodeEncodeError: "latin-1" codec can"t encode characters in position 9-10: ordinal not in range(256)

Quando faço isso no ipython qtconsole:

In [29]: "choice = u9078u629e"
Out[29]: "choice = 選択"

Então, a questão é como posso ler o arquivo de texto que contém a string de escape unicode como u9078u629e (Eu não sei exatamente o que é chamado) e convertê-lo para utf-8 como 選択?

Respostas:

2 para resposta № 1

Se você lê-lo de um arquivo, basta dar a codificação ao abrir:

with open("test.txt", encoding="unicode-escape") as f:
a = f.read()
print(a)

# choice = 選択

com test.txt contendo:

escolha = u9078u629e

Se você já tivesse seu texto em uma string, poderia convertê-lo assim:

a = "choice = \u9078\u629e"
a.encode().decode("unicode-escape")
# "choice = 選択"

Perguntas relacionadas

como posso fazer 'u' funcionar em variável em python3 - string, python-3.x, unicode, byte

Converter unicode para string - python, json, unicode, python-2.x

Como obter o ponto de código Unicode (como no banco de dados) em Python 3 - python, unicode

Códigos de caracteres unicode do Python? - python, unicode

Convertendo do Unicode em Python - python, unicode, pandas

encontre todos os fósforos para unicodes em uma corda em python - python, regex, python-2.7, unicode, python-unicode

Unicode Python, tem um número unicode na string normal, quer imprimir unicode - python, unicode

Exibindo caracteres unicode no Python 3 - python, list, unicode

Python Unicode Casting no Bug variável - python, variáveis, unicode, fundição

Regex Unicode em Python 3 (do código Python 2) - python, regex, python-3.x, unicode, python-2.x

Mostrando representação de texto do símbolo Unicode no Python 3 - python, python-3.x, unicode, emoji, python-unicode

Conversão de strings como \ uXXXX em python - python, unicode

Como faço para converter uma lista de seqüências de caracteres em um valor unicode? [duplicado] - python, unicode, codificação

Python 3: Como converter texto unicode na forma original? - python, python-3.x, python-unicode

codificação de erro string como unicode em python 2.7? - python, python-2.7, python-3.x, unicode

Função de decodificação tenta codificar Python - python, unicode, unicode-escapes

String de unicode do Python strip ()? - python, string, unicode, tira

Como transformar itens da lista em unicode sem perder a estrutura da lista - python, list

Converter ASCII para problema de codificação Unicode [duplicado] - python, python-2.x

Como converter uma string numérica para seu caractere Unicode correspondente? - python-3.x, unicode