Помощ при програмиране, отговори на въпроси / Питон / Python 2.7, библиотека с искания, не може да се получи unicode - python, parsing, unicode, python-requests

Python 2.7, Заявки библиотека, не може да получи unicode - python, parsing, unicode, python-requests

Документацията за библиотеката за заявки казва товаrequest.get () методът винаги връща unicode. Но когато се опитвам да разбера какъв код е върнат, виждам "windows-1251". Това е проблем. Когато се опитам да получа request.get (url) .text, има грешка, защото съдържанието на текущия url съдържа кирилица.

import requests

url = "https://www.weblancer.net/jobs/"
r = requests.get(url)
print r.encoding
print r.text

Имам нещо такова:

windows-1251
UnicodeEncodeError: "ascii" codec can"t encode characters in position 256-263: ordinal not in range(128)

Дали това е проблем на Python 2.7 или изобщо няма проблем? Помогни ми

Отговори:

2 за отговор № 1

От документи:

Заявките автоматично ще декодират съдържание от сървъра. най-много Unicode символи се декодират безпроблемно.

Когато правите заявка, заявките прави обосновани предположения за кодиране на отговора въз основа на HTTP заглавки.

requests.get().encoding ви казва кодирането, което е било използвано за конвертиране на битовия поток от сървъра в Unicode текста, който е в отговора.

Във вашия случай е вярно: заглавията в отговора казват, че наборът от знаци е windows-1251

Грешката, която имате, е след това. Питонът, който използвате, се опитва да кодира Unicode в ascii, за да го отпечата и не успее.

Можете да кажете печат r.text.encode(r.encoding) ... което е същият резултат като предложението на Падерик в коментарите - това е r.content.

Забележка: requests.get().encoding е lvar: можете да го настроите на това, което искате, ако се е допуснало погрешно.

Свързани въпроси

Как да стигнем до Unicode Code Point (като в базата данни) в Python 3 - python, unicode

python unicode: Как мога да преценя дали даден низ трябва да бъде декодиран в utf-8? - python, unicode, utf-8

Кодовете на Python unicode? - питън, unicode

За Python, какво означава това за <class> requests.models.Response '> - заявки тип python, class, python

намерете всички съвпадения за unicodes в низ в python - python, regex, python - 2.7, unicode, python - unicode

Python - Печат на unicode до конзолен прозорец с WConio - python, winapi, конзола, conio

Намиране на дума в Unicode в Post Response - заявки за python, post, http-post, python

Unicode Regex в Python 3 (от кода на Python 2) - python, regex, python-3.x, unicode, python-2.x

Показване на текстовото представяне на символа Unicode в Python 3 - python, python-3.x, unicode, emoji, python-unicode

Мога ли да получа SQLite за низ вместо unicode за TEXT в Python? - питън, низ, sqlite, unicode

Възглавницата ми иска ли моите текстови параметри да бъдат еднократно или низове? - python, unicode, python-imaging-библиотека, python-2.x

Python 3: Как да конвертирате текст в Unicode в оригинална форма? - python, python-3.x, python-unicode

грешка кодиране на низ като unicode в Python 2.7? - python, python-2.7, python-3.x, unicode

Python лента () Unicode низ? - python, string, unicode, лента

Как да превърнете елементите в Unicode без да губите структурата на списъка -

unicode_literals и StringIO и правилния начин да правите неща - python, django, python-2.7, unicode

AttributeError: Обектът "Отговор" няма атрибут "текст" - Python, Python-requests

Как да получите низ Unicode при извличане на данни в Python? - python, unicode, изтриване на уеб

Отпечатване на специални символи ANSI / UNICODE в Python - python, unicode, ansi

Python utf-8 Кодиране Проблем - python, xml, string, unicode, кодиране