/ / python przeszukuje rosyjskie podciągi w programie Excel - python, string, Unicode

Python przeszukuje rosyjskie podciągi w programie excel - python, string, unicode

Chcę przeczytać plik programu Excel i wyodrębnić niektóre informacje dotyczące niektórych osób.

Oto co robię

import xlrd
dir = "./schfiles";
files = os.listdir(dir);
f = files[0];
book = xlrd.open_workbook(dir+"/"+files[0]);
sh = book.sheet_by_index(0)
t = sh.cell_value(rowx=xlr2i(35),colx=xlc2i("F"))
t.find(u"Усманов")

ciąg napisany w var t to „u0434u043eu0446. u0423u0441u043cu0430u043du043eu0432 u0411.u0428.” który wygląda jak „доц. Усманов Б.Ш.”

u „Усманов” jest reprezentowany jako u „xd3xf1xecxe0xedxeexe2”

Próbowałem zakodować oba ciągi znaków w „utf8”, dekodować je, używając zewnętrznych bibliotek lib, ale nic nie pomogło.

Czy ktoś wie, jak można znaleźć tutaj konkretny podciąg?

Odpowiedzi:

0 dla odpowiedzi № 1

Posługiwać się # -*- coding: utf-8 -*- jako pierwszy wiersz skryptu informujący tłumacza, jakiego kodowania używasz.

# -*- coding: utf-8 -*-

import os
import xlrd

dir = "./schfiles"
files = os.listdir(dir)
f = files[0]

workbook_path = os.path.join(dir, files[0])
book = xlrd.open_workbook(workbook_path)

sh = book.sheet_by_index(0)
t = sh.cell_value(rowx=xlr2i(35),colx=xlc2i("F"))
t.find(u"Усманов")