私はいくつかのフィールドに漢字が含まれているパンダのデータフレームを持っています。私は以下のコードを使用します:
df = pd.read_csv("original.csv", encoding="utf-8")
df.to_csv("saved.csv")
次に、Excelやテキストエディタを使ってsaved.csvを開きます。すべての中国語文字は迷惑な文字になります。しかし、私は保存されたファイルをロードし、中国語を以下のように正しく表示することができます。
df = pd.read_csv("saved.csv")
df.head() # Chinese characters are properly displayed.
誰もが問題を解決する方法を知っていますか?
回答:
回答№1は2問題は、エンコーディングの優れた点です。
この問題を解決するには、最初にcsvを崇高で開き、File-> Save with encoding-> utf-8をBOM(Byte Order Mark)で開きます。
今すぐExcelは何の問題もなくCSVを開くことができます!
回答№2の場合は0
以下を試してください:
df = pd.read_csv("original.csv", encoding="utf-8")
df.to_csv("saved.csv", encoding="utf_8_sig")
それは私のために働く utf-8
失敗した