Aiuto nella programmazione, risposte alle domande / Pitone / Converti il problema di codifica ASCII in Unicode [duplicato] - python, python-2.x

Converti ASCII in un problema di codifica Unicode [duplicato] - python, python-2.x

Ho una domanda sulla codifica di Python 2. Sto cercando di decodificare una stringa ASCII che contiene il codice Unicode di una lettera in Unicode, e quindi ricodificarla in Latin-1, ma senza successo. Ecco un'illustrazione:

In[27]: d = u"u010d"

In[28]: print d.encode("utf-8")

č

In[29]: d1 = "u010d"

In[30]: d1.decode("ascii").encode("utf-8")

Out[30]: "\u010d"

Mi piacerebbe convertire "u010d" a "č". Esistono soluzioni integrate per evitare la sostituzione di stringhe personalizzate?

risposte:

1 per risposta № 1

Quando lo fai

d1 = "u010d"

in realtà ottieni questa stringa:

In [3]: d1
Out[3]: "\u010d"

Questo perché le stringhe "normali" (non Unicode) non riconoscono il unnnn sequenza di escape e quindi convertirlo in una letterale barra rovesciata, seguita da unnnn.

Al fine di decodificarlo, è necessario utilizzare il unicode_escape codec:

In [4]: print d1.decode("unicode_escape").encode("utf-8")
č

Ma ovviamente non dovresti usare sequenze di escape Unicode in stringhe non Unicode in primo luogo.

domande correlate

Conversione di stringhe di tipo Python 3 in python 2 - string, python-3.x, python-2.x, caratteri non ascii

Lo script Python stampa unicode, l'uso nella shell `` provoca l'errore - python, bash, python-2.7, unicode

Python 2.7, libreria Richieste, non può ottenere unicode: python, analisi, unicode, richieste python

Confronto tra le stringhe Python - Problemi con caratteri speciali / Unicode - python, string

Come convertire una lista di stringhe unicode in stringhe regolari [duplicate] - python

Lettura dei dati all'interno della casella di testo di un pdf usando python [duplicato] - python, pdf, extract, pdfminer

Visualizzazione della rappresentazione testuale del simbolo Unicode in Python 3 - python, python-3.x, unicode, emoji, python-unicode

UnicodeDecodeError in Django - python, unicode, utf-8

come decodificare in modo affidabile varie codifiche per la codifica di default del sistema: python, codifica dei caratteri

Come posso convertire un elenco di stringhe in un valore unicode? [duplicato] - python, unicode, encoding

Python, Emacs e Encoding - python, emacs, encoding

avere caratteri unicode in url - python, django

errore di codifica della stringa come unicode in python 2.7? - python, python-2.7, python-3.x, unicode

La funzione di decodifica tenta di codificare Python - python, unicode, unicode-escape

Modulo completo di sostituzione dei caratteri in python per non Unicode e non ASCII per HTML: python, unicode, codifica dei caratteri, decodifica delle stringhe

Come posso cancellare la cartella con il nome unicode in python 2.7, window 7 [closed] - python, python-2.7

File system Python e Windows con caratteri none-ascii: python, windows, ntfs

Trasforma ascii in unicode - python, utf-8

Errore Unicode di Python. UnicodeEncodeError: il codec 'ascii' non può codificare il carattere u'u4e3a '- python, unicode, encoding, utf-8, python-2.x

Simboli "???" durante il salvataggio dei file unicode in C # - c #, unicode