2014-11-11 5 views
0

Я пытаюсь загрузить как файл данных pandas файл с китайскими иероглифами в его имени.Pandas read excel with Chinese filename

Я пробовал:

df=pd.read_excel("url/某物2008.xls") 

и

import sys 
df=pd.read_excel("url/某物2008.xls", encoding=sys.getfilesystemencoding()) 

Но ответ что-то вроде: «нет такого файла или каталога "URL/\ xa1 \ xa92008.xls"

Я также пытался изменить имена файлов с помощью os.rename, но имена файлов даже не читаются должным образом (запрос python просто распечатать имена файлов дает только вопросительные знаки или квадраты).

ответ

2
df=pd.read_excel(u"url/某物2008.xls", encoding=sys.getfilesystemencoding()) 

может работать ... но вы, возможно, придется объявить тип кодировки в верхней части файла

+0

Надежда это помогает кому-то .. У меня была эта ошибка ... UnicodeDecodeError: «ASCII 'codec не может декодировать байт .... после прочтения файла Excel df = pd.read_excel ... и пытается назначить новый столбец в dataframe, подобный этому df [' new_col '] =' foo bar '. Пожалуйста, прочтите мой ответ здесь ... http://stackoverflow.com/questions/30765820/python-pandas-read-excel-returns-unicodedecodeerror-on-describe/43298880#43298880 – ihightower