Pomoc pri programovaní, odpovede na otázky / krajta / 'utf8' nemôže dekódovať bajt 0xc3 pri dekódovaní ('utf-8') v python-python, encoding, utf-8

Kodec "utf8" nemôže dekódovať bajt 0xc3 pri dekódovaní ('utf-8') v python-python, kódovanie, utf-8

Dnes som bol v mojom skripte zasiahnutý podivnou chybou:

"utf8" codec can"t decode byte 0xc3 in position 21: invalid continuation byte

Čítam údaje zo zásuvky sock.recv a výsledok je buff.decode("utf-8") kde buff sú vrátené dáta.

Ale dnes som našiel skoro "jednorožec", kde jedenznakov vrátených "▒" <- to je to, čo vykresli dekódovanie utf-8 do výnimky. Existuje nejaký predbežný proces, ktorý buď odstráni alebo nahradí takýto zvláštny znak?

odpovede:

5 pre odpoveď č. 1

Existuje druhý parameter pre .decode() pomenovaný errors, Môžete ho nastaviť "ignore" ignorovať všetky znaky, ktoré nie sú utf8, alebo ich nastaviť "replace" nahradiť ich otáznikom diamantu ( ).

buff.decode("utf-8", "ignore")

Súvisiace otázky

pip inštalovať vankúš 'utf-8' kodek nemôže dekódovať - python, utf-8, pip, inštalovať, vankúš

Má tlačiť konverziu reťazca na unicode v pythone? - python, python-2.7, unicode

Python: kodek "ascii" nemôže dekódovať byte - python

Zvláštne znaky v konzole Python - python, kódovanie

Chybné dekódovanie pomocou utf_7 - python, kodek, utf

čítať subprocesné výstupné multibajtové znaky jeden po druhom - python, python-3.x, byte, subprocess, decode

čítať utf-8 súbor CSV do dátového rámca - python, pandas, utf-8

Použite Python na vyhľadávanie a nahradenie znaku trn (þ) s potrubím (|) - python

Prechádza z kódovaných URL zdôraznil e na accented e v textovom súbore .json pomocou Python - python, utf-8, kódovanie znakov, url-encoding

Konverzia reťazca unicode na utf-8 - python, unicode, kódovanie, utf-8

Python: spracovanie zlomených bajtov unicode pri analýze reťazca JSON - python, json, unicode

Kódovanie problému pri tlači všetkých súborov na disku - python, python-2.7, kódovanie, utf-8, kódovanie znakov

Čítanie textového súboru vracia UnicodeDecodeError: kodek 'utf-8' nemôže dekódovať bajt 0x92 v jazyku Python - python, kódovanie znakov

UnicodeDecodeError: kodek 'ascii' nemôže dekódovať bajt 0xc3 v pozícii 7601: ordinal nie je v rozsahu (128) - python, python-3.5, python-unicode, urldecode

Python 3 UnicodeDecodeError: kodek 'ascii' nemôže dekódovať bajt 0xe2 v pozícii 0: ordinal nie je v dosahu (128) - python, python-3.x, pickle

Konvertujte utf-8 ako reťazec binárnych 0 a 1s na kódový bod - python, unicode, utf-8

Transformujte ascii na unicode - python, utf-8

odstránenie znakov ako 'u0152xe6' z reťazca - python, python-2.7, python-unicode

Python: binárne dáta POSTing poskytujú UnicodeDecodeError alebo Ascii error decoding - python-2.7

Dekódovanie utf-8 v python 2.7 - python 2.7, python-3.x, utf8-dekódovať