Chcę przeczytać plik programu Excel i wyodrębnić niektóre informacje dotyczące niektórych osób.
Oto co robię
import xlrd
dir = "./schfiles";
files = os.listdir(dir);
f = files[0];
book = xlrd.open_workbook(dir+"/"+files[0]);
sh = book.sheet_by_index(0)
t = sh.cell_value(rowx=xlr2i(35),colx=xlc2i("F"))
t.find(u"Усманов")
ciąg napisany w var t to „u0434u043eu0446. u0423u0441u043cu0430u043du043eu0432 u0411.u0428.” który wygląda jak „доц. Усманов Б.Ш.”
u „Усманов” jest reprezentowany jako u „xd3xf1xecxe0xedxeexe2”
Próbowałem zakodować oba ciągi znaków w „utf8”, dekodować je, używając zewnętrznych bibliotek lib, ale nic nie pomogło.
Czy ktoś wie, jak można znaleźć tutaj konkretny podciąg?
Odpowiedzi:
0 dla odpowiedzi № 1Posługiwać się # -*- coding: utf-8 -*-
jako pierwszy wiersz skryptu informujący tłumacza, jakiego kodowania używasz.
# -*- coding: utf-8 -*-
import os
import xlrd
dir = "./schfiles"
files = os.listdir(dir)
f = files[0]
workbook_path = os.path.join(dir, files[0])
book = xlrd.open_workbook(workbook_path)
sh = book.sheet_by_index(0)
t = sh.cell_value(rowx=xlr2i(35),colx=xlc2i("F"))
t.find(u"Усманов")