/ / Jak wydrukować chińskie znaki zapisane w pliku z charset „iso-8859-1” w pythonie - python, kodowanie, kodowanie znaków

Jak wydrukować chińskie znaki przechowywane w pliku z zestawem znaków "iso-8859-1" w python - python, kodowanie, kodowanie znaków

Próbuję wydrukować zawartość pliku. „plik -bi nazwa_pliku” polecenie daje „tekst / zwykły; charset = iso-8859-1”. Plik ma łańcuchy takie jak „ÏÔÔ¡ ¢ ° ² × ° ¡¢ ¸´Æ¡ ¢ · ÎÎ ¢ µ ¥» ÷ ¡° ½ÓÊÜ¡ ± ° ´ £ ¬ »òÒÔÆäËû · ½Ê½Ê¹ÓóÌÐò” chińskie znaki. Próbowałem tych na powłoce Pythona

string="ÏÂÔØ¡¢°²×°¡¢¸´ÖÆ¡¢·ÃÎÊ¡¢µ¥»÷¡°½ÓÊÜ¡±°´Å¥£¬»òÒÔÆäËû·½Ê½Ê¹ÓóÌÐò"
a= string.decode("iso-8859-1")
b=a.encode("utf-8")
print b

i

print( string.decode("iso-8859-1").encode("utf-8"))

i

source_encoding = "iso-8859-1"
string = string.encode(source_encoding)
string = unicode(string, "utf-8")

Ale nie mogę zobaczyć chińskich znakówekran, zamiast tego widziałem „à à à à áà ¢         ° ¡¢ ´à ¢ Âà à à ¡¡          Â Â Â                                                ½à ½à ¹à à ³à à ò ” Użyłem narzędzia online http://www.mdbg.net/chindict/chindict.php wybrałem Current encoding: iso-8859-1 i oryginalne kodowanie GB18030 i zobaczyłem wynik jako 国际 程序 许可 协议 ...

Czy ktoś może zasugerować mi sposób wyświetlania tych ciągów w języku chińskim za pomocą poleceń Pythona? Z góry dziękuję

Odpowiedzi:

1 dla odpowiedzi № 1

Jak sugeruje narzędzie online, file jest prawdopodobnie błędne, ponieważ „zgaduje” kodowanie. Za pomocą gb18030 ponieważ kodowanie daje poprawny wynik:

>>> s = "ÏÂÔØ¡¢°²×°¡¢¸´ÖÆ¡¢·ÃÎÊ¡¢µ¥»÷¡°½ÓÊÜ¡±°´Å¥£¬»òÒÔÆäËû·½Ê½Ê¹ÓóÌÐò"
>>> print s.decode("gb18030")
下载、安装、复制、访问、单击“接受”按钮,或以其他方式使用程序