Ayuda en la programación, respuestas a preguntas / Pitón / 'utf8' codec no puede decodificar el byte 0xc3 mientras que decodifica ('utf-8') en python - python, encoding, utf-8

El códec 'utf8' no puede decodificar el byte 0xc3 mientras decodifica ('utf-8') en python - python, encoding, utf-8

Hoy fui golpeado con un error extraño en mi script:

"utf8" codec can"t decode byte 0xc3 in position 21: invalid continuation byte

Estoy leyendo datos de socket sock.recv y el resultado es buff.decode("utf-8") donde buff son los datos devueltos.

Pero hoy encontré más o menos "unicornio" donde unode los caracteres devueltos "▒" <- esto es lo que lanza decodificar utf-8 en excepción. ¿Hay algún proceso previo que eliminaría o reemplazaría a un personaje tan extraño?

Respuestas

5 para la respuesta № 1

Hay un segundo parámetro para .decode() llamado errors. Puedes configurarlo para "ignore" para ignorar todos los caracteres que no sean utf8, o configurarlo "replace" Para reemplazarlos con el signo de interrogación de diamante ( ).

buff.decode("utf-8", "ignore")

preguntas relacionadas

el codec 'utf-8' de pip pill install no puede decodificar - python, utf-8, pip, install, pillow

¿La impresión convierte la cadena a Unicode en Python? - Python, Python-2.7, Unicode

Python: el codec 'ascii' no puede decodificar byte - python

Caracteres extraños en la consola Python - Python, codificación

Decodificación incorrecta con utf_7 - python, codec, utf

lea los caracteres de varios bytes de salida de subproceso uno por uno: python, python-3.x, byte, subprocess, decode

lea el archivo CSV de utf-8 en el marco de datos - python, pandas, utf-8

Use Python para buscar y reemplazar un personaje de espina (þ) con una tubería (|) - python

Pasando de la URL acentuada e acentuada a la acentuada en un archivo de texto .json usando Python - python, utf-8, codificación de caracteres, codificación url

Convertir una cadena Unicode a utf-8 - python, unicode, encoding, utf-8

Python: maneja bytes Unicode rotos al analizar cadenas JSON - python, json, unicode

Problema de codificación al imprimir todos los archivos de un disco: python, python-2.7, codificación, utf-8, codificación de caracteres

El archivo de texto leído devuelve UnicodeDecodeError: el códec 'utf-8' no puede decodificar el byte 0x92 en Python - python, codificación de caracteres

UnicodeDecodeError: el codec 'ascii' no puede decodificar el byte 0xc3 en la posición 7601: ordinal no está en el rango (128) - python, python-3.5, python-unicode, urldecode

Python 3 UnicodeDecodeError: el codec 'ascii' no puede decodificar el byte 0xe2 en la posición 0: ordinal no está en el rango (128) - python, python-3.x, pickle

Convierta utf-8 como una cadena de 0 y 1s binarios a punto de código - python, unicode, utf-8

Transformar ascii en unicode - python, utf-8

eliminar caracteres como 'u0152xe6' de la cadena - python, python-2.7, python-unicode

Python: POSTing datos binarios da error de decodificación UnicodeDecodeError o Ascii - python-2.7

Decodificar utf-8 en python 2.7 - python-2.7, python-3.x, utf8-decode