0
Не знаете, почему, но когда я загружаю твиты в json-файле в pandas, я получаю много странных символов.Pandas tweet json weird characters u' '
for file_name in files:
if '.json' in file_name:
file_path = WORKING_DIR + '/data/' + file_name
# Reading the json as a dict
with open(file_path) as json_d:
data = json.load(json_d, encoding='utf8')
json_df = pd.DataFrame.from_dict(data)
dfs.append(json_df)
u' 'означает, что он не смог декодировать символ с кодировкой '' utf-8''. Если вы применяете строгое декодирование, вы получите ошибку вместо u' '. Является ли файл в некоторой другой кодировке? – MYGz