Я заблокирован проблемой кодирования при использовании Scrapy, надеюсь, что кто-то может мне помочь.Как использовать Scrapy encodage
- На моем паук:
item['title'] = html.xpath('.//h5/text()')
- На трубопроводе:
item['title'] = item['title'].extract()[0].encode('utf-8', 'replace')
Это приводит строку как Namontana \xe2\x80\x93 Une attaque \xc3\xa0 main arm\xc3\xa9e avort\xc3\xa9e
. Я сохраняю все элементы в базе данных (mysql пока).
Теперь я хочу показать все эти элементы на веб-сайте, но моя проблема заключается в том, что я не могу преобразовать \ xe2 (например) в визуальный символ.
Я уже попробовать:
- Добавить
# -*- coding: utf-8 -*-
в начало всех .py файла - Использование
htmlentities
илиutf8_decode
функции, когда дисплей с PHP кода - Добавить
unicode(response.body.decode(response.encoding)).encode('utf-8')
на мой паук - Add
<meta http-equiv="content-type" content="text/html; charset=utf-8" />
к моей странице HTML - Проверить и преобразовать весь файл в UTF8 без спецификации
На данный момент единственная моя альтернатива - использовать пользовательскую функцию для замены всех символов (объясните here), но я думаю, что у них есть лучшее решение.
Заранее за вашу помощь.