Pomoc w programowaniu, odpowiedzi na pytania / Pyton / Jak mogę naprawić błędy kodowania w ciągu znaków w python - python, kodowanie

Jak mogę naprawić błędy kodowania w ciągu znaków w python - python, kodowanie

Mam skrypt Pythona jako pre-zatwierdzenie subversionhak, a ja napotykam na problemy z tekstem zakodowanym w utf-8 w przesyłanych wiadomościach. Na przykład, jeśli znak wejściowy to „å”, wyjście to „? 195? 165”. Jaki byłby najłatwiejszy sposób zastąpienia tych części znaków odpowiednimi wartościami bajtów? Regexp nie działa tak, jak muszę wykonać przetwarzanie na każdym elemencie i scalić je z powrotem.

próbka kodu:

infoCmd = ["/usr/bin/svnlook", "info", sys.argv[1], "-t", sys.argv[2]]
info = subprocess.Popen(infoCmd, stdout=subprocess.PIPE).communicate()[0]
info = info.replace("?\195?\166", "æ")

Odpowiedzi:

1 dla odpowiedzi № 1

Robię to samo w moim kodzie i powinieneś być w stanie używać:

... u_changed_path = unicode (change_path, "utf-8") ...

Korzystając z powyższego podejścia, wpadłem tylko na problemy z postaciami, takimi jak kanały itp. Jeśli opublikujesz kod, może to pomóc.

Powiązane pytania

Różnica między dekodowaniem a unicode? - python, python-2.7, unicode

Błąd podczas importowania pliku csv w języku Python przy użyciu pand - python, csv, pandy, python-import

Jak uzyskać xx = "$ £ A" jako 3-znakowy ciąg znaków - python, kodowanie, bytearray

Używanie unicode malajalam w pythonie - python, unicode, kodowanie znaków, python-unicode

Błąd BOM Pythona w pliku Ascii - python, kodowanie, ascii, znak kolejności bajtów

Python open encoding failure - python, python-2.7, kodowanie, python-3.5, python-2to3

Kodowanie Pythona 2.7 z pliku csv - python, python-2.7, pandy

Mam problem z kodowaniem w Pythonie - python, unicode, kodowanie

błąd pliku python - python, python-2.7

Python2: Użycie .decode z błędami = 'replace' nadal zwraca błędy - python, python-2.7, unicode, kodowanie znaków

wyświetlanie znaków spoza alfabetu angielskiego w odpowiedzi Pythona - python, json, python-3.x, kodowanie znaków, python-requests

Konieczność przekształcenia skryptu python 3 w skrypt Pythona 2.7 - python, python-2.7

jak niezawodnie dekodować różne kodowania do domyślnego kodowania systemowego - python, kodowanie znaków

ustawienie domyślnego kodowania w python.py [duplicate] - python, encoding, python-2.7

Python, Emacs and Encoding - python, emacs, kodowanie

Python encoding error "Non-ASCII character" xff '... "mimo, że kodowanie jest zadeklarowane jako" # - * - kodowanie: utf-8 - * - "podczas pisania Hiragana - python, kodowanie, utf-8, ascii, kana

Czytanie bajtów z pliku bez określenia kodowania w Pythonie 3 - python, plik, python-3.x, kodowanie, python-2.x

Kod Pythona działa w systemie Windows, ale nie w Linuksie - python, linux

Dekodowanie i kodowanie w języku Python, Element listy utf-8 - python-2.7, utf-8, dekodowanie ciągów

UnicodeEncodeError odoo 9 - openerp, odoo-9