Допомога у програмуванні, відповіді на питання / Python / Перетворення ASCII в кодування Unicode питання [дублікат] - Python, Python-2.x

Перетворення ASCII в кодування Unicode issue [дублікат] - python, python-2.x

У мене є питання про кодування Python 2. Я намагаюся декодувати рядок ASCII, який містить код Unicode листа до Unicode, а потім кодувати його назад до Latin-1, але без успіху. Ось ілюстрація:

In[27]: d = u"u010d"

In[28]: print d.encode("utf-8")

č

In[29]: d1 = "u010d"

In[30]: d1.decode("ascii").encode("utf-8")

Out[30]: "\u010d"

Я хотів би перетворити "u010d" до "č". Чи є вбудовані рішення для уникнення заміни користувацьких рядків?

Відповіді:

1 для відповіді № 1

Коли ти робиш

d1 = "u010d"

ви насправді отримуєте цей рядок:

In [3]: d1
Out[3]: "\u010d"

Це тому, що "звичайні" (не-Unicode) рядки не розпізнають unnnn escape-послідовність і, отже, перетворити її в літеральний зворотний слеш, за яким слід unnnn.

Для того, щоб розшифрувати це, потрібно використовувати unicode_escape кодек:

In [4]: print d1.decode("unicode_escape").encode("utf-8")
č

Але, звичайно, ви не повинні використовувати вихідні послідовності Unicode в рядках, які не є Unicode, в першу чергу.

Схожі запитання

Python 3, як перетворення рядка в python 2 - string, python-3.x, python-2.x, non-ascii-символи

Сценарій Python друкує Unicode, використовується в оболонці `` викликає помилку - python, bash, python-2.7, unicode

Python 2.7, Request Library, не може отримати Unicode - python, parsing, unicode, python-requests

Порівняння рядків Python - проблеми зі спеціальними символами / Unicode - python, string

Як перетворити список унікальних рядків у звичайні рядки [дублікат] - python

Читання даних всередині текстового поля pdf з використанням python [duplicate] - python, pdf, extract, pdfminer

Показано текстове зображення символу Unicode в Python 3 - python, python-3.x, unicode, emoji, python-unicode

UnicodeDecodeError в Django - python, unicode, utf-8

як надійно розшифрувати різні кодування до системного кодування за замовчуванням - python, character-coding

Як перетворити список строк у значення Unicode? [дублікат] - python, unicode, кодування

Python, Emacs і кодування - python, emacs, encoding

мати унікодові символи в url - python, django

рядок кодування помилок як unicode в python 2.7? - python, python-2.7, python-3.x, unicode

Функція декодування намагається кодувати Python - python, unicode, unicode-escapes

Всеосяжний модуль заміни персонажа в python для не-unicode і non-ascii для html - python, unicode, character-coding, string-decoding

Як я можу видалити папку з ім'ям Unicode в python 2.7, вікно 7 [closed] - python, python-2.7

Python та Windows файлова система з символами none-ascii - python, windows, ntfs

Перетворення ASCII на Unicode - python, utf-8

Помилка унікального Python. UnicodeEncodeError: 'ASCII' кодек не може кодувати символ u'u4e3a »- пітона, Unicode, кодування, UTF-8, пітон-2.x

Символи "???" при збереженні файлів Unicode в C # - c #, unicode